Únase a los principales ejecutivos hoy en línea en la Cumbre de datos el 9 de marzo. Registrarse aquí.
En su explicación detallada en video de más de dos horas sobre cómo ve el funcionamiento del metaverso en el futuro, Meta ofreció a más de 2000 oyentes en línea tanto descripciones de alto nivel como detalles sobre varias áreas específicas de este nuevo mundo propuesto. Incluyeron cómo la empresa liderada por Facebook está utilizando la inteligencia artificial y el aprendizaje automático en el metaverso para la investigación, el desarrollo de productos, la ejecución de un traductor universal de idiomas, el suministro de información del ser humano a los asistentes personales y el establecimiento del uso responsable de la IA y todo el personal. datos que lo acompañan.
[ Special Report — The Metaverse: How close are we? ]
El CEO Mark Zuckerberg realizó una descripción general de alto nivel de 16 minutos de la sesión del día, y enfatizó varias veces que su empresa está dando la máxima prioridad a la construcción del Metaverso con un enfoque “responsable” para la gestión de datos, lo que le hizo perder la credibilidad de Facebook en los años pasados Siguieron ocho presentaciones en la sesión de 140 minutos.
Los asistentes personalizados que entienden a las personas y les permiten controlar el flujo de la conversación pueden facilitar la vida de las personas y allanar el camino para dispositivos más inteligentes, en casa o en movimiento. Pero hoy, en 2022, todavía dejan mucho que desear en términos de comprensión de las solicitudes, velocidad y precisión de la información.
“Los asistentes de hoy, tanto por voz como por chat, generalmente están decepcionados”, dijo Head of Conversational AI Technology Meta Geramifard de Alborz Ella dijo. “Hay varias razones por las cuales, empezando por cómo están diseñadas. Estamos compartiendo los desafíos que enfrentan los desarrolladores e ingenieros cuando intentan crear asistentes útiles y cómo podemos abordar esos desafíos a medida que construimos para el metaverso”.
La esperanza de Zuckerberg para su empresa es crear un asistente personal que avergüence a Siri, Alexa y Google. Aunque Meta aún no ha elegido un nombre para él, Zuckerberg dijo que Meta quiere que su asistente de voz sea más intuitivo: recopile pistas contextuales en conversaciones, junto con otros puntos de datos que puede recopilar sobre nuestros cuerpos, como hacia dónde se dirige nuestra mirada. , expresiones faciales y gestos con las manos.
“Para respaldar la creación y exploración del mundo real, debemos ir más allá del estado actual del arte de los asistentes inteligentes”, dijo Zuckerberg. “Cuando tengamos las gafas en la cara, será la primera vez que un sistema de inteligencia artificial podrá ver realmente el mundo desde nuestra perspectiva: ver lo que vemos, escuchar lo que escuchamos y más. De ahí que la capacidad y las expectativas que tengamos para los sistemas de inteligencia artificial serán mucho mayores”.
El equipo de Meta parece estar listo para esas tareas desafiantes. Durante la presentación, Meta también presentó el proyecto CAIRaoke, que Geramifard calificó como “una investigación pionera que tiene como objetivo hacer que los asistentes sean más útiles y las interacciones con ellos más agradables. El proyecto CAIRaoke es un modelo de inteligencia artificial creado para agentes conversacionales. Funciona de extremo a extremo. -fin, combinando los cuatro modelos existentes que suelen utilizar los asistentes de hoy en día en un modelo único, más eficiente y flexible”.
El proyecto CAIRaoke está aprovechando años de avance en el procesamiento del lenguaje natural en lugar de conversaciones escritas proporcionadas por aplicaciones profundamente contextualizadas y personalizadas, y el usuario es responsable del flujo de la conversación, dijo Geramifard.
“Este sistema unificado está mejor diseñado para conversaciones naturales y puede acomodar sus flujos normales pero complicados”, dijo Geramifard.
Una de las innovaciones más sustanciales de la sesión fue la introducción del traductor universal de idiomas de Meta, que cuando se use ampliamente permitirá mucho más que el entendimiento entre culturas: conducirá a un mejor intercambio de datos, ciencia y proyectos empresariales.
Más de 2000 idiomas y dialectos ahora se usan todos los días en algún lugar del mundo. Universal Language Translator permitirá a cualquier persona traducir cualquier idioma a uno o más, utilizando inteligencia artificial y aprendizaje automático en tiempo real. Actualmente, solo alrededor de 100 idiomas se pueden traducir uno a uno, siendo el inglés, con mucho, el más utilizado.
La idea es reducir el predominio de los “idiomas mayoritarios”, dijo Angela Fan de Meta, y aumentar el valor de los idiomas menos conocidos y usados.
“Más del 20% de la población mundial está excluida del acceso a la información en Internet porque no pueden leer en un idioma que les conviene”, dijo. Ventilador, ella misma una traductora multilingüe especializada en aprendizaje automático de Shanghái que ha vivido en Canadá, Estados Unidos y Francia. “A medida que avanza el acceso a la tecnología, las capacidades de traducción automática y de idiomas son limitadas. Para garantizar la inclusión, debemos apoyar a todos, independientemente del idioma que hablen. Hoy levantaremos el telón de un ambicioso cuerpo de trabajo que tiene como objetivo brindar a las personas la oportunidad de acceder a cualquier cosa en Internet en su idioma nativo y hablar con cualquier persona, independientemente de sus preferencias de idioma”.
Algunos ejemplos del uso de este traductor, que ahora está en desarrollo Meta: En un mercado en Kenia, vendedores, artistas y clientes de toda África podrían negociar fácilmente en cualquiera de los muchos idiomas que pueden pagar. Un emprendedor en China podría aprender de las mismas lecciones que se dan en otros centros tecnológicos.
En el futuro, las gafas AR podrían traducirse instantáneamente para un ingeniero que hable con técnicos locales en la India rural que hablen cualquier idioma, incluida la docena que se habla allí. Imagine un mundo en el que las traducciones de todos los idiomas escritos y hablados se incluyan en meta IA.
“El idioma no son solo los sonidos que hablamos o las palabras que escribimos, sino la conexión fundamental de un individuo con su familia, cultura, historia y tradiciones de generación en generación”, dijo Fan. “Piensa en la música que escuchas, las fiestas que podrías celebrar o la comida que comes. El lenguaje sirve como base para nuestra identidad. Porque es una de las principales herramientas que utilizamos para comprender y por ende interactuar con el mundo que nos rodea”.
Meta está trabajando con socios especializados en voz y audio para ayudar a hacer estos avances en la tecnología de traducción, dijo Fan. Se estima que el traductor está a unos años de la operación generalizada.
La inteligencia artificial es un componente fundamental de los sistemas Meta que hace de todo, desde clasificar publicaciones en las noticias de Facebook hasta combatir el discurso de odio y la desinformación. Pero, al igual que con otras tecnologías emergentes, la IA también plantea muchas preguntas difíciles sobre cuestiones como la privacidad, la equidad, la responsabilidad y la transparencia.
Facebook admite más de 2500 millones de usuarios en todo el mundo y obviamente no puede controlar la entrada de tantos usuarios. Sin embargo, ha sido criticado por las deficiencias en este departamento durante los últimos cinco años y está ansioso por mejorar su reputación allí. Parece un desafío interminable, pero el personal de Meta no se detiene.
“Nuestro compromiso es construir IA de manera responsable y utilizar un equipo interdisciplinario para apoyar estos esfuerzos; tenemos ejemplos tangibles de cómo estamos desarrollando y probando enfoques para garantizar que nuestros sistemas de aprendizaje automático (ML) se diseñen y utilicen de manera responsable “, dijo el gerente sénior de programas de inteligencia artificial de Facebook. pan jaqueline Ella dijo.
Meta crea y prueba enfoques para garantizar que sus sistemas de aprendizaje automático se diseñen y utilicen de manera responsable, dijo Pan.
“Nuestra misión es garantizar que la IA y el ML beneficien a las personas de la sociedad. Esto ahora requiere una colaboración profunda tanto interna como externa a través de un conjunto diverso de equipos, incluidas partes de grupos de plataforma, legisladores y expertos legales. Apoyo de los niveles más altos de liderazgo mental e investigadores que están verdaderamente inmersos en la comunidad en general. También desarrollamos nuestras prácticas consultando y colaborando regularmente con expertos externos y reguladores. Además, colaboramos con expertos externos de comunidades interesadas en instituciones académicas y con partes interesadas de la industria para comprender las expectativas de la comunidad en general en lo que respecta a la inteligencia artificial”, dijo Pan.
Un ejemplo del trabajo de Facebook sobre la equidad de IA este año, dijo Pan, fue cuando el equipo de IA se asoció con otro equipo interno para publicar conjuntos de datos de “conversaciones informales”. “Creamos y lanzamos conversaciones aleatorias para satisfacer la necesidad de conjuntos de datos de alta calidad diseñados para ayudar a evaluar el posible sesgo algorítmico en sistemas complejos de IA del mundo real”, dijo Pan.
El conjunto de datos constaba de más de 45 000 videos de participantes pagados que tenían conversaciones sin guión; los participantes revelaron su edad y género, lo que permitió que este conjunto de datos fuera una colección relativamente imparcial de muestras de género asiático. Además, el equipo pudo proporcionar etiquetas sobre el tono de la piel y las condiciones de iluminación ambiental. Este conjunto de datos está diseñado para ayudar a los investigadores a evaluar la precisión de sus modelos de audio y visión por computadora en estas dimensiones, dijo Pan.
“Con este conjunto de datos, esperamos desbloquear más investigación y medición de equidad y acercar el campo a la creación de tecnologías más equitativas e inclusivas”, dijo Pan.
La misión de VentureBeat debe ser una plaza de la ciudad digital para que los tomadores de decisiones técnicas obtengan información sobre la tecnología y las transacciones comerciales transformadoras. para saber mas