OpenAI está buscando un ingeniero de comunicaciones para el equipo detrás de GPT-4o, el chatGPT. Según la plataforma de empleo de la empresa, el rango salarial para esta vacante es de entre $310.000 y $465.000 al año.
La descripción del puesto destaca que es el primer puesto de este tipo que OpenAI quiere contratar. “Estamos buscando un ingeniero con experiencia en comunicaciones en tiempo real (RTC) para unirse a OpenAI como nuestro primer especialista dedicado en RTC”:
La startup que cuenta con inversión de Microsoft anunció su nuevo modelo GPT-4o, capaz de interactuar con los usuarios a través de voz en tiempo real. Por ejemplo, esta IA es capaz de traducir conversaciones entre dos personas que hablan idiomas diferentes.
Para este lanzamiento, OpenAI está buscando un ingeniero de comunicaciones en tiempo real para pulir GPT-4o.
En la descripción mencionan que el trabajo es en San Francisco, California, sin embargo, en otro apartado que describe el puesto, OpenAI pregunta al candidato: “¿Necesitará patrocinio ahora o en el futuro para obtener el estatus de visa de trabajo en Estados Unidos? ” ¿Unido?”. Por ello, no está claro si se trata de un trabajo presencial o si puede ser a distancia en un principio.
La empresa tecnológica también detalla las responsabilidades de este puesto:
- Innovar técnicas para integrar inteligencia artificial y comunicación en tiempo real, asegurando una latencia mínima.
- Establecer nuevos estándares para la transmisión de entradas y salidas de audio y vídeo entre usuarios y modelos.
- Liderar esfuerzos multifuncionales y alineación entre equipos de infraestructura, productos y investigación.
La empresa detrás del popular chatbot ChatGPT sugiere que los candidatos para este puesto de ingeniero de comunicaciones tengan las siguientes características:
- Tener amplios conocimientos de WebRTC, códecs de audio y vídeo y sistemas de streaming de baja latencia.
- Tener experiencia en la creación de sistemas de software de producción a escala.
- La experiencia con modelos de IA y lenguaje extenso es una ventaja, pero no es obligatoria.
Además del rango salarial de $310.000 a $465.000 anuales, la persona seleccionada tiene acceso a:
- Seguro médico, dental y de visión para el empleado y su familia.
- Apoyo a la salud mental.
- Licencia parental remunerada (20 semanas) y apoyo a la planificación familiar.
El modelo de inteligencia artificial para el que OpenAI solicita un ingeniero en comunicaciones se caracteriza por la entrada y salida de audio, es decir, la IA puede entenderte y responderte con su propia voz.
GPT-4o tiene la capacidad de producir contenido y comprender comandos en formatos de voz, texto o imagen.lo que amplía significativamente las opciones de interacción entre humanos y inteligencia artificial.
La empresa compartió un vídeo en el que se prueba el nuevo modelo. Consistía en una conversación entre dos personas, una que hablaba italiano y otra inglés. OpenAI demostró que GPT-4o tenía la capacidad de traducir ambos idiomas en tiempo real.
Esta inteligencia artificial estará disponible de forma gratuita para todos los usuarios de ChatGPT en los próximos meses.
La voz de ChatGPT también ha sido un tema candente debido a que la reconocida actriz de Marvel, Scarlett Johansson, expresó su desacuerdo por la similitud con su tono de voz.
ChatGPT tiene cinco voces diferentes: Breeze, Cove, Ember, Juniper y Sky. De este último es del que se quejó Johansson.
“Mis amigos, familiares y el público en general se dieron cuenta de lo mucho que me parecía el nuevo sistema llamado Sky. Antes de que pudiéramos conectarnos (con Sam Altman, el sistema ya estaba en el mercado), publicó Johansson en un comunicado.
A principios de 2023, OpenAI trabajó con directores de casting y productores de esta industria para establecer criterios específicos para sus voces de IA.
Para abordar las inquietudes relacionadas con la voz de Sky y salvaguardar la integridad de los autores de voz contratados por la startup, OpenAI decidió suspender temporalmente esta voz en ChatGPT.