Las 8 empresas más innovadoras en inteligencia artificial y aprendizaje automático

A medida que las empresas intentan cada vez más aprovechar sus datos utilizando inteligencia artificial y aprendizaje automático, el paisaje de proveedores y proyectos de código abierto puede resultar abrumador. Y si algo es seguro, es que solo se está volviendo más caótico.

Como mencionó Matt Turck, socio de FirstMark, en 2021 la industria presenció la "rápida emergencia de toda una nueva generación de startups de datos y ML", y en 2022 esta tendencia parece continuar. La IA/ML está tan en boga, de hecho, que incluso con una recesión en puerta, los directores de tecnología se muestran renuentes a recortar el gasto en proyectos de IA/ML.

Entonces, ¿en qué invertirán las empresas ese dinero? O mejor dicho, ¿con quién?

Para ayudarlo a navegar por la a veces desconcertante variedad de opciones de IA/ML, hablé con profesionales de la ciencia de datos para obtener sus selecciones de las compañías más innovadoras en IA/ML. Aunque históricamente la industria se centró en la IA llamativa, como las computadoras que podían jugar juegos o aparentemente ofrecer razonamiento humano, gran parte de la innovación actual reside en áreas menos llamativas pero más esenciales como la preparación de datos y las preocupaciones operativas.

Índice de Contenido

Nubes de hiperescala
Los 8 innovadores más destacados en IA/ML
1. Coiled
2. OctoML
3. MindsDB
4. Zone7
5. BLOOM
6. Landing AI
7. Databricks
8. Hugging Face

Nubes de hiperescala

Para muchas empresas, la opción más fácil para la IA/ML será utilizar los servicios de IA/ML ofrecidos por su proveedor de nube preferido. Aunque por lo general se atribuye a Google el tener el conjunto más sólido de servicios de IA/ML, cualquiera de las grandes nubes será una elección sólida. Google ha liderado el mercado al abrir el código fuente de marcos clave como TensorFlow y, más recientemente, ha facilitado que las empresas ejecuten cosas como TensorFlow en producción con Cloud AutoML.

AWS ha tendido a innovar menos en términos de marcos y, en cambio, se ha centrado en herramientas como Sagemaker Studio, un entorno de desarrollo integrado para aprendizaje automático, para ayudar a las empresas a hacer más con menos experiencia. Microsoft ofrece algo similar en Azure Machine Learning, que permite a los usuarios configurar operaciones y flujos de trabajo de aprendizaje automático. Las tres nubes también ofrecen una gran cantidad de servicios impulsados por API, como Amazon Polly, un servicio de texto a voz.

La brecha de poder y daño de la IA

Como se mencionó, muchas empresas comenzarán y finalizarán con los servicios de IA/ML que descubran con su proveedor de nube predeterminado. Eso está bien, pero se pierde gran parte de la innovación que está sucediendo en otros lugares, en startups y más allá. Aunque cada empresa debe buscar a su proveedor de nube para obtener servicios de IA/ML, también deben considerar a los innovadores como los que se describen a continuación.

Los 8 innovadores más destacados en IA/ML

Coiled

Aunque las empresas adoptaron R en los primeros días de la ciencia de datos, Python ha reemplazado a R como el lenguaje dominante para IA/ML. Dask, un proyecto de código abierto que facilita la escalabilidad de las cargas de trabajo de Python, se ha convertido en un elemento imprescindible para el público especializado en ciencia de datos, ya que permite escalar bibliotecas computacionales populares como NumPy, pandas y scikit-learn más allá de una sola máquina a máquinas multinúcleo y clústeres distribuidos.

Scikit-learn puede aprovechar Dask para la paralelización, lo que permite al científico de datos entrenar estimadores utilizando todos los núcleos de un clúster sin realizar cambios significativos en el código subyacente. Esta forma de paralelismo es fundamental para el aprendizaje automático, ya que los científicos de datos necesitan dividir los cálculos en un clúster para ejecutar en conjuntos de datos grandes.

La empresa detrás de Dask, Coiled, administra clústeres de Dask en AWS o Google Cloud, lo que facilita la ejecución de clústeres de Dask en producción. La innovación de Dask de Coiled consiste en facilitar a los profesionales de Python hacer más con el aprendizaje automático, permitiendo que los científicos de datos se mantengan utilizando las bibliotecas de Python que les encantan, mientras Coiled se encarga de "provisionar recursos en la nube, manejar fallas de instancias, coordinar la sincronización de datos entre máquinas y asegurar el entorno en la nube", como explicó el desarrollador de Dask, James Courbeau.

OctoML

De manera similar, OctoML introduce agilidad y automatización de nivel DevOps en la implementación de ML en cualquier hardware. En resumen, OctoML optimiza el rendimiento del modelo de ML en cualquier hardware, sin importar dónde se esté ejecutando. Dado que llevar los modelos a la producción es uno de los mayores obstáculos para la productividad empresarial con IA/ML, OctoML está abordando un problema difícil.

El problema de implementación se vuelve más difícil debido al conjunto rígido de dependencias entre un marco de entrenamiento de ML como PyTorch, el modelo en sí y los diferentes hardware en los que se ejecutará. OctoML crea automáticamente código personalizado para parámetros de hardware específicos, selecciona bibliotecas y opciones de compilador adecuadas y luego configura la configuración de la configuración de hardware para ajustar el rendimiento. Esto requiere conocimiento de más de 80 objetivos de implementación.

Razones para implementar IA en el borde: protección de datos

Esta optimización de la implementación del modelo llevó a los fundadores de la compañía a comenzar con la publicación del código fuente de lo que se convirtió en Apache TVM, un compilador de aprendizaje profundo que se ha convertido en el compilador de aprendizaje profundo de facto para gigantes del ML como Amazon y Facebook. Basándose en esa experiencia, OctoML ahora intenta que todas las empresas puedan implementar modelos de aprendizaje automático en configuraciones de hardware variadas de manera más sencilla.

MindsDB

Siguiendo la tendencia de hacer que el ML sea más accesible para una amplia población de usuarios, MindsDB se trata de llevar el poder del ML a algo que las empresas ya utilizan a diario: sus bases de datos. Como alguien me explicó, MindsDB es una forma de aumentar el "coeficiente intelectual de las bases de datos".

¿Cómo se logra esto? Permitiendo a los usuarios agregar una capa de predicción basada en ML a sus conjuntos de datos. Esto significa que cualquier persona con conocimientos de SQL puede agregar capacidades de ML a sus bases de datos al agregar una capa de predicción basada en ML a sus conjuntos de datos. Esta capa, o extensión de SQL, permite que se creen, consulten y mantengan modelos de ML como si fueran tablas de bases de datos. MindsDB se encuentra en el punto exacto donde se encuentran los profesionales de datos, proporcionándoles un atajo para adquirir habilidades en ML.

De esta manera, MindsDB ayuda a las organizaciones a aprovechar mejor sus datos para obtener pronósticos sobre cómo serán los datos futuros en función de los datos pasados. Por supuesto, el ML siempre ha dependido de extraer datos de bases de datos y otras fuentes. La diferencia con el enfoque de MindsDB es que las empresas no necesitan molestarse en extraer, transformar y cargar sus datos en otros sistemas. La gran innovación de MindsDB es hacer posible el ML directamente en la base de datos.

Zone7

Puede que yo esquíe más de 150 días cada temporada en las montañas vírgenes de Utah, pero lamentablemente no tengo la oportunidad de ser un esquiador profesional. Por lo tanto, nunca podré usar Zone7, "la plataforma de rendimiento humano impulsada por IA" que analiza datos extensivos de atletas para sugerir los mejores regímenes de descanso y entrenamiento para equipos deportivos profesionales.

Si eso parece un nicho, tal vez lo sea. Pero llevó a que Liverpool, uno de los clubes de fútbol más exitosos del planeta, redujera las lesiones en un tercio la temporada pasada, incluso mientras el equipo competía en múltiples competiciones y ganaba dos de ellas. Los deportes son un gran negocio y un número cada vez mayor de equipos profesionales en ligas de fútbol, fútbol americano y rugby están recurriendo a Zone7.

Aruba revoluciona con nuevas capacidades de AIOps

Entonces, ¿qué hace exactamente la compañía? Como han detallado ellos mismos, "Zone7 analiza datos completos de los jugadores, incluida información de posicionamiento en el juego y el entrenamiento, así como niveles biométricos, de fuerza, sueño y estrés. Por su parte, la plataforma identifica patrones de riesgo no detectados, crea alertas en tiempo real sobre amenazas de lesiones y ofrece métodos de intervención prácticos para ayudar a guiar e informar la toma de decisiones de los entrenadores".

Zone7, en otras palabras, no es algo que usted o su empresa probablemente utilicen. Sin embargo, es algo que su equipo favorito podría adoptar. Dada la cantidad de lesiones de mi equipo de fútbol (Arsenal), eso no puede suceder lo suficientemente rápido.

BLOOM

BLOOM es un lenguaje de programación de código abierto y multilingüe que tiene como objetivo abordar los sesgos que los sistemas de ML heredan de sus textos de entrenamiento. En todos los demás ejemplos proporcionados aquí, las innovaciones de IA/ML están a la venta. No ocurre lo mismo con BLOOM. De hecho, este es un requisito clave del lenguaje, ya que intenta romper el dominio de las grandes empresas tecnológicas en el procesamiento del lenguaje natural. Aunque las empresas están involucradas, organizadas en un grupo llamado BigScience, ninguna empresa controla BLOOM.

Los costos y la experiencia asociados con el entrenamiento de grandes modelos de lenguaje para hacer inferencias estadísticas entre miles de millones de palabras son inmensos, por lo que solo las grandes empresas pueden permitirse participar. En cambio, BLOOM está siendo desarrollado y moldeado por cientos de investigadores, incluidos algunos de Facebook y Google, que trabajan como individuos en el verdadero espíritu del código abierto.

En lugar de seguir el enfoque estándar de entrenar el modelo en función del texto extraído de Internet, solo imagine lo imparcial que sería un modelo basado en un día de texto de Twitter, los investigadores seleccionaron cuidadosamente aproximadamente dos tercios de su conjunto de datos de 341 mil millones de palabras de 500 fuentes. Esto no garantiza que BLOOM esté libre de sesgos, pero como proyecto de código abierto, los contribuyentes pueden mejorarlo para eliminar los sesgos.

Es importante destacar que BLOOM estará disponible de forma gratuita. Sí, habrá un costo asociado con su ejecución, pero Hugging Face y otras compañías están buscando formas de minimizar los costos. BLOOM aún no está disponible para su uso, pero podría democratizar significativamente el procesamiento del lenguaje natural.

Qué es la Ley de Responsabilidad Algorítmica

Landing AI

Landing AI debería estar en la lista de todos como uno de los innovadores en IA/ML, si no es por otra razón que porque fue fundada por Andrew Ng, cofundador de Coursera y líder fundador de Google Brain. Ng es una figura importante en el campo de big data y, con su experiencia, tiene experiencia en poner en práctica el aprendizaje automático (ML). Por lo tanto, no es sorprendente que Landing AI se enfoque en mejorar la calidad de los datos.

La preparación de datos tiende a ser hasta el 70% del trabajo realizado por los científicos de datos, y Landing AI intenta mejorar esto al adoptar un enfoque "centrado en los datos" para el ML. Como lo expresó Ng, "en lugar de enfocarse en el código, las compañías deben concentrarse en desarrollar prácticas de ingeniería sistemáticas para mejorar los datos de una manera confiable, eficiente y sistemática".

El primer producto de la compañía es LandingLens, una plataforma de MLOps empresarial para la visión por computadora. LandingLens es una plataforma de inspección visual que tiene como objetivo garantizar la calidad del producto al mejorar la precisión de la inspección y reducir los falsos positivos. Lo logra a través de la colaboración entre ingenieros de ML para entrenar, probar, confirmar e implementar modelos de aprendizaje profundo basados en datos verificados y de alta calidad en dispositivos periféricos dentro del proceso de fabricación. Landing AI intenta aplicar ML de vanguardia a industrias tradicionales como la fabricación, la atención médica y la agricultura.

Databricks

Databricks está lejos de ser una startup y eso se refleja en su plataforma integral y holística de ML, que incluye servicios gestionados para el seguimiento de experimentos, entrenamiento de modelos, desarrollo y gestión de características, así como servicios de entrega de características y modelos. Databricks inició Delta Lake, un enfoque de "lakehouse" para incorporar grandes cantidades de datos empresariales en un solo lugar. A partir de ahí, la compañía ofrece una plataforma que permite a los equipos de ML colaborar en la preparación y el procesamiento de datos, brindando un enfoque centralizado y estandarizado para trabajar con datos y modelos de ML asociados.

Databricks se integra bien con cada uno de los proveedores de nube, especialmente Microsoft Azure. Aunque Databricks se basa en Apache Spark, los usuarios también pueden utilizar sus lenguajes de programación preferidos como Python, R y SQL, y Databricks se encarga de garantizar que funcionen correctamente con Spark.

De hecho, este tipo de trabajo es probablemente la mayor innovación de Databricks: brindar a los científicos de datos y a otros una plataforma integral para el seguimiento de experimentos, la reproducción de resultados a gran escala, la implementación de modelos en producción y la implementación y actualización de modelos actualizados. Otras compañías abordan aspectos aislados de estos desafíos, pero Databricks adopta un enfoque integral de principio a fin.

El valor de la inteligencia artificial estrechamente enfocada en aplicaciones específicas

Hugging Face

La compañía con el nombre más extraño también puede ser la más innovadora. Hugging Face, que comenzó como un chatbot y evolucionó para ofrecer un registro de modelos de procesamiento del lenguaje natural (NLP) utilizados para ofrecer esos chatbots, ahora está en camino de convertirse en el GitHub del aprendizaje automático. En la actualidad, la compañía aloja más de 100,000 modelos de transformadores preentrenados y más de 10,000 conjuntos de datos para NLP, visión por computadora, habla, series de tiempo y aprendizaje por refuerzo. Más de 10,000 empresas utilizan Hugging Face para colaborar en aplicaciones de ML de forma privada.

Desde hace mucho tiempo, ha sido un obstáculo para la adopción de ML que la colaboración dentro de una organización haya sido tan desafiante. Diferentes equipos podrían estar construyendo modelos esencialmente iguales, duplicando esfuerzos, y no había un enfoque estandarizado para construir e implementar modelos de transformadores.

Hugging Face resuelve esto al facilitar la búsqueda y la colaboración en modelos dentro de una organización, al igual que GitHub y GitLab lo hacen para el código. La compañía ofrece su API de inferencia, que proporciona acceso a decenas de miles de modelos preentrenados. Esto es importante porque la mayoría de las empresas carecen de la experiencia necesaria para construir modelos por sí mismas.

La compañía también ofrece AutoTrain, que ayuda a las empresas a desarrollar y ajustar automáticamente modelos con facilidad. Finalmente, Hugging Face se encarga de la implementación. Y al igual que con GitHub, un usuario de Hugging Face puede combinar lo mejor de los transformadores públicos con modelos privados de manera segura.

Clement Delangue, cofundador y CEO de Hugging Face, cree que el número de profesionales de ML podría superar el número de desarrolladores para 2027. Al hacer que el ML sea accesible para una variedad más amplia de profesionales, incluidos los desarrolladores, Hugging Face bien podría ser un acelerador clave para alcanzar esa meta. La compañía, que ha publicado bajo licencias de código abierto elementos clave de su tecnología desde su fundación como chatbot, ha convertido la colaboración abierta en un principio fundamental tanto para cómo construye como para cómo permite a otros construir. Hasta ahora, parece que está funcionando.

Divulgación: Trabajo para MongoDB, pero los puntos de vista expresados aquí son míos.

El mercado de software de automatización robótica de procesos (RPA) crecerá un 19

En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Inteligencia artificial, allí encontraras muchos artículos similares a Las 8 empresas más innovadoras en inteligencia artificial y aprendizaje automático , tenemos lo ultimo en tecnología 2023.