Proyectos del Hackathon #Somos600M

¡Te presentamos los proyectos de la edición 2024 de nuestro hackathon!

María Grandury· 23 abr 2024· 3min

¿Tienes curiosidad por ver los proyectos que se han desarrollado durante el Hackathon #Somos600M? ¡Aquí están!

👏 Un total de 18 proyectos de PLN en español enfocados en modelos de lenguaje que siguen instrucciones, ¡enhorabuena a todos los equipos!

🎦 Además, los vídeos de las presentaciones están disponibles enesta playlist de YouTubejunto a los talleres y charlas de especialistas celebrados durante el hackathon.

🤗 Todos los recursos están disponibles en el Hub de Hugging Face:hf.co/somosnlp

Esperamos que os gusten y que surjan muchas aplicaciones utilizando estos nuevos recursos abiertos 💛

Proyectos del Hackathon 2024

¡Presentamos los proyectos del Hackathon #Somos600M! 🤩

Queremos dar la enhorabuena a todos los equipos por un hackathon increíble con proyectos de gran impacto. Enumeramos a continuación los proyectos por orden de envío. ¡Próximamente anunciaremos los ganadores!


NoticIA: Resumen de Noticias Clickbait

Un dataset para el resumen de artículos clickbait en Español.

La práctica del Clickbait erosiona la confianza del público en las fuentes de noticias digitales y perjudica los ingresos publicitarios de los productores de contenido legítimo, que pueden experimentar una disminución en su tráfico web como resultado. Para abordar este desafío, hemos creado un corpus con 850 artículos de noticias clickbait en español. Cada artículo está acompañado de un resumen generativo de alta calidad y concisión, redactado por expertos humanos.

ODS:8. Trabajo decente y crecimiento económico

Proyecto:

¡Enhorabuena equipo!

  • Iker García-Ferrero
  • Begoña Altuna

SpanishMedicaLLM: Modelo de Lenguaje Médico en Español

Un gran modelo de lenguaje de contexto médico de código abierto para preguntas y respuestas en español, utilizando autoajuste con QLora para bajos recursos de cómputo.

ODS:3. Salud y bienestar

Proyecto:

¡Enhorabuena equipo!

  • Dionis López Ramos
  • Álvaro García-Barragán
  • Dylan Montoya
  • Dariel Enmnauel Cabrera Lopez

RecetasDeLaAbuel@: Corpus de recetas de países hispanoamericanos

El corpus ‘RecetasDeLaAbuel@’ es un homenaje a todas nuestr@s abuel@s que nos han enseñado a cocinar. Se trata de la mayor y más completa colección de recetas en español de países hispanoamericanos.

Nuestra misión es la creación de una IA en español que agrupe recetas de países hispanoamericanos y permita mejorar nuestra relación con la preparación y el cocinado de los alimentos. El objetivo final es la construcción de un asistente de cocina inteligente específico del idioma español.

ODS:3. Salud y bienestar

Proyecto:

¡Enhorabuena equipo!

  • Alberto
  • Óscar
  • Gabriel
  • Sara
  • Fredy

ComeBien: Asistente de nutrición inteligente

ComeBien es un asistente de nutrición inteligente específico del idioma español que permite ayudarnos a comer de una manera saludable.

Nuestra misión es la creación de una IA en español que complemente recetas de países hispanoamericanos con su valor nutricional y permita mejorar nuestra relación con la comida. El objetivo final es la construcción de un asistente de nutrición inteligente específico del idioma español.

ODS:3. Salud y bienestar

Proyecto:

¡Enhorabuena equipo!

  • Alberto
  • Andrea

AsistenciaRefugiados: Asistencia legal para refugiados

Asistente legal para personas en situación de refugio o asilo político.

España es el tercer país con mayor número de solicitudes de asilo, recibiendo cada año aproximadamente más de 100.000 solicitudes, y el tercero con menor número de aprobaciones dentro de la UE.

El objetivo principal de este proyecto es facilitar las tareas de las ONG de este ámbito y de otras instituciones y ayudarles a obtener respuestas a preguntas (QA) relacionadas con la legislación sobre refugiados en español. Con su refinada comprensión de los matices y complejidades de este campo legal.

ODS:10. Reducción de las desigualdades 16. Paz, justicia e instituciones sólidas

Proyecto:

¡Enhorabuena equipo!

  • Eduardo Muñoz Sala
  • Álvaro Hidalgo
  • Teresa Martín

Aviación Inteligente: LLMs para Navegar el RAC

Investigación que utiliza modelos de lenguaje de última generación para mejorar la comprensión y navegación del Reglamento Aeronáutico Colombiano (RAC), con el objetivo de facilitar el acceso a la información y mejorar la seguridad en la aviación civil.

ODS:4. Educación de calidad, 9. Industria, innovación e infraestructura

Proyecto:

¡Enhorabuena equipo!


LingComp_QA: Un corpus educativo de lingüística computacional en español

LingComp_QA es un primer acercamiento que hemos hecho a la recolección de información sobre lingüística computacional, ya que consideramos que no hay suficientes recursos educativos en torno a este tema. Tenemos intención de ampliarlo y crear un modelo para alumnos de Lingüística y otros interesados en ponerse al día en PLN.

ODS:4. Educación de calidad, 9. Industria, innovación e infraestructura, 17. Alianzas para lograr los objetivos

Proyecto:

¡Enhorabuena equipo!

  • Jorge Zamora Rey
  • Mario Crespo Miguel
  • Isabel Moyano Moreno

BERTIN-ClimID: BERTIN-Base Climate-related text Identification

Identificación de textos sobre sustentabilidad y cambio climático

Motivados por la idea de crear una repositorio en español sobre información o recursos en temas como cambio climático, sustentabilidad, calentamiento global, energía, etc. La idea es dar visibilidad a soluciones, ejemplos de buenas prácticas ambientales o noticias que nos ayuden a combatir los efectos del cambio climático.

ODS:13. Acción por el clima

Proyecto:

¡Enhorabuena equipo!

  • Gabriela Zuñiga
  • Gerardo Huerta

LenguajeClaro

Este modelo es el primer paso hacia un modelo de lenguaje que pueda usarse para reescribir textos de carácter administrativo con el objetivo de hacerlos más asequibles para todo el mundo.

ODS:3. Salud y bienestar, 9. Industria, innovación e infraestructura, 10. Reducción de las desigualdades

Proyecto:

¡Enhorabuena equipo!

  • Sergio Chicón
  • Marta Fernández
  • Rubén Rodríguez

ChaterapIA

Dar acceso a ayuda psicológica a personas en necesidad. No importan tus recursos, la hora o el sitio, si necesitas ayuda siempre tendría que ser posible tener acceso a ella.

ODS:3. Salud y bienestar, 10. Reducción de las desigualdades

Proyecto:

¡Enhorabuena equipo!

  • Julio
  • Joana

Think Paraguayo

Think Paraguayo es un proyecto destinado a promover y difundir la cultura guaraní utilizando la inteligencia artificial como herramienta principal. El objetivo es crear conciencia sobre la riqueza cultural del Paraguay y preservar la lengua y las tradiciones guaraníes mediante el uso de tecnologías de procesamiento del lenguaje natural.

ODS:4. Educación de calidad

Proyecto:

¡Enhorabuena equipo!

  • Enrique Paiva
  • Daniel Cabrera
  • Leticia Bogado
  • Alberto Benítez
  • Emmanuel

SQLES: Interactúa con una base de datos en español

Este proyecto tiene como objetivo desarrollar una herramienta que pueda interactuar en español con una base de datos utilizando un enfoque multimodal, que combina modelos de lenguaje y consultas SQL. La meta es facilitar la extracción de información de bases de datos de manera intuitiva y eficiente en el idioma español.

ODS:8. Trabajo decente y crecimiento económico, 9. Industria, innovación e infraestructura

Proyecto:

¡Enhorabuena equipo!

  • Asis Rangel Ventura Rivera
  • Néstor Emmanuel
  • Alexis Fernando Morales

Traductor-Inclusivo: Reescritura de textos en español utilizando lenguaje inclusivo

Herramienta que permite reescribir textos en español utilizando lenguaje inclusivo.

El lenguaje o palabras que utilizamos muchas veces pueden imponer sesgos, ideologías o marginar a determinados grupos. “Traductor inclusivo” es una herramienta que permite reescribir textos utilizando lenguaje inclusivo ofreciendo una opción para evitar dichos sesgos.

ODS:5. Igualdad de género

Proyecto:

¡Enhorabuena equipo!

  • Andrés Martínez Fernández-Salguero
  • Gaia Quintana Fleitas
  • Miguel López

KUNTUR: LLM de asistencia legal en textos jurídicos de Perú

El proyecto KUNTUR busca abordar la brecha de acceso a la información legal en Perú, especialmente para comunidades rurales y personas sin experiencia en derecho. Su objetivo es desarrollar un modelo de lenguaje especializado que haga que la ley sea más comprensible y accesible para todos, capacitando a individuos con conocimientos legales para tomar decisiones informadas y proteger sus derechos.

ODS:4. Educación de calidad, 16. Paz, justicia e instituciones sólidas

Proyecto:

¡Enhorabuena equipo!

  • David Alonso Quispe Castillo

Identificación de provincias y resúmenes con el COSER

En este proyecto se han generado dos corpus de instrucciones para la identificación de provincias de hablantes y resumen de las entrevistas basándose en el Corpus Oral y Sonoro del Español Rural.

ODS:4. Educación de calidad, 10. Reducción de las desigualdades

Proyecto:

¡Enhorabuena equipo!

  • Clara Adsuar
  • Álvaro Bueno
  • Benito
  • Alberto Hernández
  • Manuel Otero