La tecnología del Galaxy S25 lo hace rápido, fácil y efectivo para usted: búsquedas óptimas para fotos y videos de edición. Se sabe que los desarrolladores de Samsung se saben cómo la compañía ha desarrollado estas soluciones avanzadas
Encontrar una foto específica en la galería interminable de un teléfono inteligente puede llevar mucho tiempo. Editar varios videos uno por uno también puede ser tedioso y repetitivo.
La serie Galaxy S25 utiliza la tecnología de Vision y la comprensión del lenguaje natural para resolver estos problemas y ofrecer una experiencia móvil más intuitiva a los usuarios en su vida cotidiana. Al buscar una foto en su galería, los usuarios pueden ingresar palabras clave que describan la situación, como la fecha o el lugar, cualquier objeto presente, cualquier acción que tenga lugar, etc. y la galaxia las analizarán para encontrar las fotos que coinciden. Además, la serie emblemática tiene un recorte automático, una nueva función de edición de video que puede seleccionar automáticamente segmentos clave de varios videos y editarlos en un video separado.
Estas funciones son el resultado de una investigación avanzada en tecnología visual y una estrecha colaboración. Samsung Newsroom se reunió con los desarrolladores del equipo de tecnología visual de Samsung Research y el negocio de Samsung Electronics de Samsung Electronics para saber cómo la compañía ha desarrollado experiencias fotográficas y de video aún más inteligentes para los usuarios de galaxias.
▲ (De izquierda a derecha) Wonwoo Lee, Inho Choi, Hongpeo Lee y Seongwan Kim, por Samsung Research and Mobile Experience (MX) Business
Etiquetado de todos los elementos de una foto con clasificación basada en AI
Los teléfonos inteligentes almacenan una gran cantidad de fotos, y el usuario promedio tiene varios miles, o incluso decenas de miles, en sus dispositivos. A medida que aumenta el número, se vuelve cada vez más difícil encontrar una foto específica de inmediato. En la serie Galaxy S25, la etiqueta de la aplicación de la galería y clasifica automáticamente varios elementos de las fotos, como objetos, personas y lugares, lo que permite a los usuarios encontrar las imágenes deseadas rápidamente y precisión. Esto es increíblemente cómodo para los usuarios que desean revivir recuerdos pasados o recuperar información importante rápidamente.
Teniendo en cuenta que una búsqueda efectiva depende de la clasificación, los desarrolladores triplicaron el número de tipos de etiquetas en comparación con la de la serie Galaxy anterior, refinando las capacidades de reconocimiento de los sujetos en las fotos y el etiquetado en la serie Galaxy S25. Además, ampliaron el alcance de la agrupación, una técnica que agrupa los datos para el reconocimiento de las personas.
“Mediante el desarrollo de un motor de análisis de imágenes y el uso de la tecnología de disparo cero, hemos mejorado el rendimiento para que la serie Galaxy S25 pueda reconocer por primera vez los datos del objeto que encuentra”, dice Hongpeo Lee, del equipo de tecnología visual de Samsung Research. “En el caso de las personas, hemos ampliado el análisis más allá de las características faciales para incluir ropa, tiempo y ubicación, lo que facilita la agrupación de fotos de la misma persona”.
Encuentra fotos con lenguaje conversacional y natural a través de la búsqueda de galerías
Samsung también se dedicó a mejorar el rendimiento de la búsqueda del lenguaje natural en la galería. La compañía ha desarrollado un modelo de búsqueda que refleja las frases más utilizadas y los diferentes casos de aplicación, lo que permite a los usuarios encontrar las fotos que desean utilizando frases naturales y conversacionales en lugar de palabras basadas en palabras.
“Aprovechamos un modelo de visión de lenguaje que aprende al asociar imágenes para enviar mensajes de texto y usar generativo para generar automáticamente una amplia gama de frases que los usuarios podrían ingresar”, compartió Lee. “También optimizamos y comprimimos el modelo de búsqueda para ejecutar rápidamente en el dispositivo”.
“Según nuestras investigaciones anteriores, hemos aplicado con éxito las capacidades de procesamiento del lenguaje natural a nuestros productos, incluido un motor de análisis de imágenes sensible al contexto y un modelo de lenguaje amplio (LLM)”, dijo el Inho Choi, del equipo de soluciones visuales MX de Samsung Electronics.
Los desarrolladores también trabajaron para ofrecer resultados de búsqueda extraños y más precisos. “Queríamos anticipar las diferentes situaciones de uso e identificar de antemano posibles problemas para las consultas de búsqueda maliciosas para no dar lugar a resultados inexactos”, explicó Choi. “Crear una base de datos de palabras negativas, blasfemias y neologismos, y luego probar a los usuarios para mejorar la precisión de las búsquedas fue la parte más difícil y gratificante del proceso”.
▲ Inho Choi por MX Business y Hongpyo Lee por Samsung Research
Editar varios videos al mismo tiempo con recortes automáticos
La edición de video también se está convirtiendo en una parte cada vez más importante de la experiencia de la galería. Aunque el video es una forma popular de consumo de medios, tener herramientas de edición de video fácilmente disponibles y usarlas fácilmente a menudo no es tan simple como parece. Para resolver esto, la serie Galaxy S25 presenta una función que hace que la edición sea mucho más rápida y cómoda gracias al análisis de video mejorado basado en la IA. AUT AUT AUTO TRIM extrae escenas clave de varios videos elegidos por el usuario para crear un nuevo video de formato corto.
Para el ajuste automático, era importante analizar rápidamente videos de hasta 90 minutos, generar un video editado y ajustar la duración de ese nuevo video. Los desarrolladores lo consiguieron gracias a la estrecha colaboración, integrando perfectamente el conocimiento tecnológico avanzado de la investigación de Samsung con las capacidades de optimización móvil de MX Business.
“Las tecnologías de análisis de video existentes tienen limitaciones, como los tamaños grandes de los modelos, las velocidades de procesamiento lentas y la selección uniforme de segmentos de video clave”, dijo Seongwan Kim del equipo de soluciones visuales de MX Business Visual. “Hemos optimizado el rendimiento de procesamiento de video de las pruebas de la serie Galaxy S25 y verificación de múltiples soluciones candidatas para ofrecer una experiencia de edición rápida y simple basada en la IA en el dispositivo”.
“Hemos incorporado una función que permite a los usuarios identificar los momentos clave de los videos, que exigen un procesamiento de datos significativamente mayor que el de las fotos, y adaptar la duración de estos segmentos editados a sus preferencias”, dijo Wonwoo Lee, del equipo de tecnología visual de Samsung Research.
“Obtener que Galaxy AI identificó los puntos destacados en los videos con un nivel de sensibilidad comparable al de los humanos fue un desafío, pero al establecer los estándares juntos, Samsung Research y MX Business podrían mejorar significativamente la funcionalidad general”.
De análisis a generación: la IA de la visión y sus infinitas posibilidades
Samsung Electronics está investigando una amplia gama de tecnologías de visión, desde tecnologías de filmación y edición de teléfonos inteligentes hasta tecnologías de interacción multimodal utilizadas en realidad aumentada (RA) y realidad virtual (RV). La parte central de esta investigación es la capacidad de analizar sujetos como personas y animales, así como sus alrededores, en videos en el dispositivo, y reconocer los momentos significativos de esos videos. Con la tecnología Visual AI, Samsung no solo tiene la intención de mejorar las funciones típicas de los teléfonos inteligentes, como la captura y la visualización de fotos y videos, sino también ser pionero en nuevas formas de consumir contenido.
“Estamos utilizando activamente la tecnología AI para una edición rápida, simple y de alta calidad en el campo de los videos”, dijo Kim. “Samsung se concentrará en continuar desarrollando tecnología para que la IA pueda comprender mejor el contexto de contenido de video, ayudando a los usuarios a reducir efectivamente el tiempo de edición y generar videos editados que reflejan la intención del usuario, todo esto sin la necesidad de conocimientos de edición profesional”.
“Con el avance continuo de la tecnología de análisis de video, nuestro objetivo es desarrollar funciones aún más innovadoras que aprovechen el poder de comprender el contenido de video, como la búsqueda de videos, los efectos inteligentes de edición de video y más”, dijo Wonwoo Lee. “Samsung se esforzará por desarrollar la tecnología Avant -Garde Vision que se puede aplicar en una amplia gama de casos de uso”.
▲ Seonghwan Kim de Mx Business y Wonwoo Lee de Samsung Research
La búsqueda en la galería y el ajuste automático son ejemplos de cómo Galaxy Ai mejora la vida cotidiana. A medida que los desarrolladores continúan avanzando en la tecnología de análisis de imágenes de la compañía, Samsung Electronics ofrecerá una gama cada vez más amplia de nuevas experiencias que harán que sea más fácil e intuitivo para los usuarios encontrar y capturar los momentos clave de la vida.