Google presenta servicios generativos impulsados por IA en su conferencia Google Cloud Next 2023
Google presentó una amplia gama de nuevos servicios basados en IA generativa en su conferencia Google Cloud Next 2023 en San Francisco el 29 de agosto. En la pre-breve, tuvimos un vistazo anticipado al nuevo Cloud TPU de Google, las máquinas virtuales A4 alimentadas por NVIDIA H100 GPUs y más.
Ir a:
- Aumento de capacidad y otras mejoras en Vertex AI
- Actualizaciones de BigQuery y AlloyDB listas para vista previa
- A3: supercomputadoras virtuales con NVIDIA para entrenamiento de IA reveladas
- Cloud TPU v5E: optimizado para inferencias de IA generativa
- Presentación de Google Kubernetes Engine Enterprise edition
- Aumento de capacidad y otras mejoras en Vertex AI
- Actualizaciones de BigQuery y AlloyDB listas para vista previa
- Revelación de las supercomputadoras virtuales A3 con NVIDIA para entrenamiento de IA
- Cloud TPU v5e: optimizado para inferencias de IA generativa
- Presentación de Google Kubernetes Engine Enterprise edition
Aumento de capacidad y otras mejoras en Vertex AI
June Yang, vicepresidente de Cloud AI y soluciones industriales en Google Cloud, anunció mejoras en Vertex AI, la plataforma de IA generativa de la compañía que ayuda a las empresas a entrenar sus propios modelos de IA y aprendizaje automático.
Los clientes han solicitado la capacidad de ingresar una mayor cantidad de contenido en PaLM, un modelo fundamental en la plataforma Vertex AI, dijo Yang, lo que llevó a Google a aumentar su capacidad de 4,000 tokens a 32,000 tokens.
Los clientes también han solicitado que se admitan más idiomas en Vertex AI. En la conferencia Next '23, Yang anunció que PaLM, que reside dentro de la plataforma Vertex AI, ahora está disponible en árabe, chino, japonés, alemán, español y más. Eso suma un total de 38 idiomas para uso público; se ofrecen 100 idiomas adicionales en vista previa privada.
ChatGPT Enterprise: Privacidad mejorada para negociosVertex AI Search, que permite a los usuarios crear un motor de búsqueda dentro de sus aplicaciones impulsadas por IA, está disponible hoy. "Piense en esto como una búsqueda de Google para los datos de su empresa", dijo Yang.
También disponible hoy es Vertex AI Conversation, que es una herramienta para construir chatbots. La búsqueda y la conversión estaban disponibles anteriormente con nombres de productos diferentes en la Generative AI App Builder de Google.
Mejoras en el modelo base Codey
Codey, el modelo de texto a código dentro de Vertex AI, está recibiendo una actualización. Aunque los detalles sobre esta actualización son escasos, Yang dijo que los desarrolladores deberían poder trabajar de manera más eficiente en la generación de código y la comunicación de código.
"Con el uso de nuestro modelo base Codey, socios como GitLab están ayudando a los desarrolladores a mantenerse en el flujo al predecir y completar líneas de código, generar casos de prueba, explicar código y muchos casos de uso más", señaló Yang.
Combina el estilo artístico de tu negocio con IA de texto a imagen
El modelo de texto a imagen de Vertex ahora podrá realizar ajustes de estilo, o ajustarse a la marca y las directrices creativas de una empresa. Las organizaciones solo necesitan proporcionar 10 imágenes de referencia para que Vertex comience a trabajar según su estilo propio.
Nuevas incorporaciones a Model Garden, la biblioteca de modelos de Vertex AI
Google Cloud ha agregado los modelos Llama 2 de Meta y Claude 2 de Anthropic a la biblioteca de modelos de Vertex AI. La decisión de agregar Llama 2 y Claude 2 al Model Garden AI de Google Cloud está "en línea con nuestro compromiso de fomentar un ecosistema abierto", dijo Yang.
Automatiza tareas en Google Sheets con SheetGPT: ¡Ahorra tiempo y esfuerzo!"Con estas adiciones en comparación con otros proveedores de hiperescala, Google Cloud ahora ofrece la mayor variedad de modelos para elegir, con nuestros modelos Google de primera mano, modelos de terceros de socios, así como modelos de código abierto en una sola plataforma", dijo Yang. "Con acceso a más de 100 modelos seleccionados en Vertex AI, los clientes ahora pueden elegir modelos según la modalidad, el tamaño, el rendimiento, la latencia y las consideraciones de costo".
Actualizaciones de BigQuery y AlloyDB listas para vista previa
BigQuery Studio de Google, una plataforma de banco de trabajo para usuarios que trabajan con datos e IA, y AlloyDB ahora tienen actualizaciones disponibles en vista previa.
Se agrega BigQuery Studio a la vista previa del almacén de datos en la nube
BigQuery Studio se implementará en el almacén de datos en la nube BigQuery de Google en vista previa esta semana. BigQuery Studio ayuda con el análisis y la exploración de datos e se integra con Vertex AI. BigQuery Studio está diseñado para reunir la ingeniería de datos, el análisis y el análisis predictivo, reduciendo el tiempo que los profesionales de análisis de datos necesitan para cambiar entre herramientas.
Los usuarios de BigQuery también pueden agregar a partir de ahora a Duet AI, el asistente de IA de Google.
AlloyDB mejorado con IA generativa
Andy Goodman, vicepresidente y director general de bases de datos en Google, anunció la adición de capacidades de IA generativa a AlloyDB, la base de datos compatible con PostgreSQL de Google para cargas de trabajo empresariales de alto nivel, durante la pre-breve. AlloyDB incluye capacidades para organizaciones que construyen aplicaciones de IA empresariales, como capacidades de búsqueda vectorial hasta 10 veces más rápidas que las de PostgreSQL estándar, según Goodman. Los desarrolladores pueden generar incrustaciones vectoriales dentro de la base de datos para agilizar su trabajo. AlloyDB AI se integra con Vertex AI y ecosistemas de herramientas de código abierto como LangChain.
"Las bases de datos son el corazón de la innovación de IA generativa, ya que ayudan a cerrar la brecha entre los modelos de lenguaje de gran escala y las aplicaciones de IA generativa empresariales para brindar experiencias precisas, actualizadas y contextuales", dijo Goodman.
Inversión millonaria en chips de IA: el Reino Unido lidera la revolución tecnológicaAlloyDB AI ahora está disponible en vista previa a través de AlloyDB Omni.
Revelación de las supercomputadoras virtuales A3 con NVIDIA para entrenamiento de IA
La disponibilidad general de las máquinas virtuales A3 que funcionan con NVIDIA H100 GPU como supercomputadoras virtuales se abrirá el próximo mes, anunció Mark Lohmeyer, vicepresidente general manager para la infraestructura de aprendizaje automático y computación en Google Cloud, durante la pre-breve.
La infraestructura de la máquina virtual A3 de 200 Gbps, hecha a medida, tiene transferencia de datos de GPU a GPU, lo que le permite omitir el host de la CPU. Las transferencias de datos de GPU a GPU impulsan el entrenamiento, ajuste y escalado de IA con hasta 10 veces más ancho de banda que la generación anterior, A2. El entrenamiento será tres veces más rápido, dijo Lohmeyer.
"NVIDIA nos permite ofrecer la cartera de infraestructura de IA más completa de cualquier nube", dijo Lohmeyer.
Cloud TPU v5e: optimizado para inferencias de IA generativa
Google presentó Cloud TPU v5e, la quinta generación de TPU en la nube optimizada para inferencias de IA generativa. Un TPU, o Tensor Processing Unit, es un acelerador de aprendizaje automático alojado en Google Cloud. El TPU maneja las enormes cantidades de datos necesarios para la inferencia, que es un proceso lógico que ayuda a los sistemas de inteligencia artificial a hacer predicciones.
Cloud TPU v5e ofrece un rendimiento dos veces más rápido por dólar para el entrenamiento y un rendimiento 2.5 veces mejor por dólar para inferencias en comparación con el TPU de la generación anterior, dijo Lohmeyer.
GPT-4: El nuevo modelo de inteligencia artificial que imita el habla y razonamiento humano"(Con) la magia de ese software y hardware que trabajan juntos con nuevas tecnologías de software, como multi-slice, estamos permitiendo a nuestros clientes escalar fácilmente sus modelos de IA [generativa] más allá de los límites físicos de un solo grupo de TPU físico o un solo clúster de TPU", dijo Lohmeyer. "En otras palabras, una sola carga de trabajo de IA grande ahora puede abarcar múltiples grupos de TPU físicos, ampliándose a literalmente decenas de miles de chips y haciéndolo de manera muy rentable".
El nuevo TPU está disponible en vista previa a partir de esta semana.
Presentación de Google Kubernetes Engine Enterprise edition
Google Kubernetes Engine, que muchos clientes utilizan para cargas de trabajo de IA, está recibiendo una mejora. La edición empresarial de GKE incluirá escalado horizontal multi-cluster y servicios existentes de GKE que se ejecutan en GPU en la nube y TPU en la nube. Informes iniciales de los clientes han mostrado ganancias de productividad de hasta el 45%, según Google, y reducción de los tiempos de implementación de software en más del 70%.
GKE Enterprise Edition estará disponible en septiembre.
Salesforce establece una política de uso aceptable para su inteligencia artificial (IA)En Newsmatic nos especializamos en tecnología de vanguardia, contamos con los artículos mas novedosos sobre Inteligencia artificial, allí encontraras muchos artículos similares a Google presenta servicios generativos impulsados por IA en su conferencia Google Cloud Next 2023 , tenemos lo ultimo en tecnología 2023.
Artículos Relacionados