Domingo 18 de Enero de 2026       •      Dólar= $886,05      •      UF=$39.744,55       •      UTM=$69.751
05/12/2025

Red Hat ofrece inferencia de IA mejorada en AWS

Red Hat anunció la expansión de su colaboración con Amazon Web Services (AWS) para impulsar soluciones empresariales de Inteligencia Artificial generativa (IA gen) en AWS a través de Red Hat AI y los chips de IA de AWS. Con esta colaboración, Red Hat busca empoderar a los responsables de la toma de decisiones de TI con la flexibilidad necesaria para ejecutar inferencia de IA de alto rendimiento y eficiente a escala, independientemente del hardware subyacente.

El auge de la IA gen y la consecuente necesidad de inferencia escalable están llevando a las organizaciones a reevaluar su infraestructura de TI. Como resultado, IDC predice que “para 2027, el 40% de las organizaciones utilizará silicio personalizado, incluidos procesadores ARM o chips específicos para AI/ML, para satisfacer las crecientes demandas de optimización del rendimiento, eficiencia de costos y computación especializada”. Esta tendencia refuerza la necesidad de soluciones optimizadas para mejorar la capacidad de procesamiento, minimizar los costos y permitir ciclos de innovación más rápidos para aplicaciones de IA de alto rendimiento.

La colaboración de Red Hat con AWS empodera a las organizaciones con una estrategia completa de IA gen, al unir una vasta biblioteca de recursos de plataforma de Red Hat con la infraestructura de nube y los chipsets de IA de AWS: AWS Inferentia2 y AWS Trainium3. Los aspectos clave de esta nueva fase de la asociación incluyen:

Red Hat AI Inference Server en chips de IA de AWS: el Red Hat AI Inference Server, basado e impulsado por vLLM, estará habilitado para ejecutarse con los chips de IA de AWS, incluidos AWS Inferentia2 y AWS Trainium3, para ofrecer una capa de inferencia común, capaz de soportar cualquier modelo de IA gen, brindando más rendimiento, menor latencia y mejor rentabilidad al escalar despliegues de IA en producción, con una eficiencia hasta un 30-40% superior a las instancias Amazon EC2 basadas en GPU actualmente comparables.

Habilitando la IA en Red Hat OpenShift: Red Hat trabajó con AWS para desarrollar un operador de AWS Neuron para Red Hat OpenShift, Red Hat OpenShift AI y Red Hat OpenShift Service on AWS, una plataforma de aplicaciones completa y totalmente administrada en la base de Amazon, proporcionando a los clientes una ruta más simple y con soporte para ejecutar sus cargas de trabajo de IA con aceleradores de AWS.

Facilidad de acceso y despliegue: al ofrecer soporte a los chips de IA de AWS, Red Hat proporcionará un acceso mejorado y simplificado a aceleradores de alta demanda y alta capacidad para clientes de Red Hat en AWS. Además, Red Hat lanzó recientemente la Colección Ansible Certificada amazon.ai para la Plataforma de Automatización Red Hat Ansible, entorno en el que es posible orquestar servicios de IA en AWS.

Contribución con la comunidad upstream: Red Hat y AWS están colaborando para optimizar un plugin de chip de IA de AWS para que esté disponible upstream en vLLM. Como principal colaboradora comercial de vLLM, Red Hat está comprometida a habilitar vLLM en AWS con el fin de acelerar las capacidades de inferencia y entrenamiento de IA para los usuarios. vLLM también tiene como arquitectura técnica a llm-d, proyecto de código abierto enfocado en ofrecer inferencia a escala, ahora disponible como recurso comercial en Red Hat OpenShift AI 3.

“Al habilitar el Red Hat AI Inference Server para el sector empresarial, desarrollado sobre el innovador framework vLLM, con chips de IA de AWS, estamos empoderando a las organizaciones para desplegar y escalar cargas de IA con mayor eficiencia y flexibilidad. Basada en la herencia de código abierto de Red Hat, esta colaboración busca hacer que la IA generativa sea más accesible y económicamente viable en entornos de nube híbrida”, indicó Joe Fernandes, vicepresidente y gerente general de la Unidad de Negocios de IA de Red Hat.

Noticias Relacionadas
Infoblox adquiere compañía que brinda protección basada en IA (16/01/2026)
TCS y AMD buscan escalar la adopción empresarial de IA (15/01/2026)
Oracle anuncia nuevo Director Senior de Marketing para América Latina (14/01/2026)
Dell potencia su línea de portátiles XSP (08/01/2026)
Contáctenos
Dirección: José Manuel Infante 919, Of. 203,
Providencia, Chile
Teléfono: (562) 2433 5500
Email: info@emb.cl
Visite también:
© Copyright 2023 Editora Microbyte Ltda.