Top Posts
Un balance de la lucha de la CNTE:...
Asamblea de Daniel Noboa aprueba instalación de bases...
La (des)nazificación de Alemania
El sistema de castas y los dilemas de...
AgroALBA arrancó en Venezuela: estrategias solidarias para producir...
¡No en nuestro nombre! Manifiesto de feministas contra...
Presidente Maduro propone Escuela de Agricultura Regenerativa para...
EE. UU. vs. China: ¿quién manda en el comercio...
Entre el wokeismo y el populismo de derecha
PALESTINA Y LA SOLIDARIDAD INTERNACIONAL
  • Colectivo Insurgencia Magisterial
Portal Insurgencia Magisterial
Banner
  • Inicio
  • Nosotros/Legal
  • Directorio
  • Alianzas
  • Columnistas
  • Voces que seguimos
  • Calendario de eventos
  • Educooperando
Espacio principalEspacio secundario

Pequeños modelos de lenguaje: 10 Tecnologías Emergentes 2025

por RedaccionA mayo 7, 2025
mayo 7, 2025
239

Por: Will Douglas Heaven. 07/05/2025

Los grandes modelos lingüísticos desataron el poder de la IA. Ahora es el momento de hacer más con menos 

QUIÉNES: Instituto Allen de Inteligencia Artificial, Anthropic, Google, Meta, Microsoft, OpenAI. 

CUÁNDO: Ahora. 

No nos confundamos: en el mundo de la IA, el tamaño importa. Cuando OpenAI lanzó GPT-3 allá por 2020, era el modelo lingüístico más grande jamás construido. La empresa demostró que bastaba con aumentar el tamaño de este tipo de modelo para que el rendimiento se disparara. Esto dio lugar a un boom tecnológico que se ha mantenido gracias a modelos cada vez más grandes desde entonces. Como dijo Noam Brown, investigador científico de OpenAI, ante el público de TEDAI San Francisco en octubre, «el increíble progreso de la IA en los últimos cinco años puede resumirse en una sola palabra: escala». 

Pero a medida que las ganancias marginales que logran estos modelos más y más grandes son cada vez menores, los investigadores están descubriendo cómo hacer más con menos. Para determinadas tareas, los modelos modelos de lenguaje reducidos (SML, por las siglas en inglés de small language models) que se entrenan con conjuntos de datos más específicos pueden rendir tan bien como los grandes o incluso mejor. Esto supone una gran ventaja para las empresas deseosas de desplegar la IA para un puñado de aspectos específicos. No hace falta tener todo Internet en el modelo para responder al mismo tipo de petición una y otra vez. 

OpenAI ofrece GPT-4o y GPT-4o mini; Google DeepMind tiene Gemini Ultra y Gemini Nano; y Claude 3, de Anthropic, está disponible en tres tamaños: Opus, Sonnet y Haiku. Microsoft es pionera en una gama de pequeños modelos de lenguaje llamados Phi. 

Cada vez son más las empresas de menor tamaño que también ofrecen modelos pequeños. La empresa de inteligencia artificial Writer afirma que su último modelo lingüístico iguala el rendimiento de los modelos más grandes de primer nivel en muchos parámetros clave, a pesar de que en algunos casos sólo tiene la vigésima parte de parámetros (los valores que se calculan durante el entrenamiento y determinan cómo se comporta un modelo). 

Los modelos más pequeños son más eficientes, por lo que son más rápidos de entrenar y ejecutar. Es una buena noticia también para quienes están preocupados por el clima: como los modelos más pequeños funcionan con una fracción de la potencia que requieren sus primos gigantes, consumen menos energía. 

Estos pequeños modelos también viajan bien: pueden funcionar directamente en nuestros bolsillos, sin necesidad de enviar peticiones a la nube. Lo pequeño es lo próximo.  

LEER EL ARTÍCULO ORIGINAL PULSANDO AQUÍ

Fotografía: Technology review

Compartir 0 FacebookTwitterWhatsapp
RedaccionA

noticia anterior
Suspenden fallo de jueza y orden de aprehensión contra Evo Morales sigue vigente
noticia siguiente
Wifi en la Amazonía: el dilema de la conectividad

También le podría interesar

El capitalismo contra la globalización

junio 10, 2025

Chips chinos: la ofensiva de EE. UU. no...

junio 10, 2025

Venezuela. Maduro exhorta a países a no depender...

junio 7, 2025

Visitantes en este momento:

519 Usuarios En linea
Usuarios: 100 Invitados,419 Bots

Blog: Perspectivas comunistas

Desde el Plantón magisterial en el Zócalo de la CDMX

Nuestras redes sociales

Blog de la Columna CORTOCIRCUITOS

Nuestros grupos de difusión

Artículos publicados por mes

Síguenos en Facebook

Síguenos en Facebook

Artículos por AUTORES

Artículos publicados por FECHA

junio 2025
L M X J V S D
 1
2345678
9101112131415
16171819202122
23242526272829
30  
« May    

Artículos más leídos esta semana

  • 1

    La CNTE y el acto de desenlatar la lucha de clases en México

    junio 6, 2025
  • 2

    ¡NO NOS VAMOS, SOLO NOS HACEMOS UN POCO MAS A LA IZQUIERDA!

    junio 6, 2025
  • 3

    Primer round: CNTE desnuda carácter neoliberal de la 4T

    junio 7, 2025
  • 4

    Alto al ataque mediático contra la CNTE, magisterio, organizaciones y sindicatos

    junio 2, 2025
  • 5

    Banco Azteca es premiado con 25 % de las AFORES: Pedro Hernández de la CNTE

    mayo 30, 2025
  • 6

    La CNTE: autonomía y movilización en el marco de una hegemonía progresista (3/3)

    junio 3, 2025
  • ¿Cuáles son los elementos de una historieta?

    febrero 15, 2017
  • 8

    Ante la ratificación del Director del Colegio Preparatorio de Xalapa por parte de la USICAMM la Dirección de Bachillerato lo “retira” de manera arbitraria. Comunidad escolar inicia protestas

    junio 3, 2025
  • 9

    Daniela Griego, Presidenta Municipal electa de Xalapa. Recibe su constancia de mayoría

    junio 5, 2025
  • 10

    México. Maestros de la CNTE, continúa la huelga

    junio 4, 2025
  • 11

    ¡Quién miente?, ¿la presidenta o la CNTE?

    junio 1, 2025
  • 12

    AFORES: un robo para los trabajadores. ¿Quiénes son y cuántas cuentas controlan?

    mayo 25, 2025
  • 13

    Colombia. Potente huelga contra el boicot de la derecha al referendo de reforma laboral

    junio 5, 2025
  • 14

    La CNTE: autonomía y movilización en el marco de una hegemonía progresista (2/3)

    junio 1, 2025

Rolando Revagliatti. Argentina

Raúl Allain. Perú

Juan Antonio Guerrero O. México

Vanesa Monserrat. Argentina

Carolina Vásquez Araya

Ilka Oliva-Corado

Javier Tolcachier

Columna: CORTOCIRCUITOS

Manuel I. Cabezas González

Luis Armando González

Iliana Lo Priore

Jorge Salazar

Adolfo del Ángel Rodríguez

Oswualdo Antonio G.

José Eduardo Celis

Daniel Suárez

Güris J. Fry

Jorge Díaz Piña

Ángel Santiago Villalobos

Andrés Brenner

Alejandra Cortina

José Carlos Buenaventura

Luis Palacios

@2020 - Insurgencia Magisterial

Portal Insurgencia Magisterial
  • Inicio
  • Nosotros/Legal
  • Directorio
  • Alianzas
  • Columnistas
  • Voces que seguimos
  • Calendario de eventos
  • Educooperando
Portal Insurgencia Magisterial
  • Inicio
  • Nosotros/Legal
  • Directorio
  • Alianzas
  • Columnistas
  • Voces que seguimos
  • Calendario de eventos
  • Educooperando
@2020 - Insurgencia Magisterial

Leer también:x

Las nuevas caras del fraude en la...

noviembre 30, 2024

Inteligencia artificial, entre el deseo y el...

febrero 27, 2023

La “amenaza” de la inteligencia artificial y...

junio 14, 2023