Top Posts
Algunos aspectos del problema de la periodización de...
Ni los unos de los otros, el pueblo
¡La salud comunitaria también es organización popular! (Ciudad...
Boric en una noche fría: La calle como...
DIF CDMX busca despedir a trabajadora para pagar...
La pobreza desde la óptica Capitalista de la...
Premio Gabo 2025: Las 15 mejores historias periodísticas...
El Proyecto Gran Simio solicita a las autoridades...
¿Y si dejamos de ser tolerantes con los...
No más agresiones a la Revolución Cubana
  • Colectivo Insurgencia Magisterial
Portal Insurgencia Magisterial
Banner
  • Inicio
  • Nosotros/Legal
  • Directorio
  • Alianzas
  • Columnistas
  • Voces que seguimos
  • Calendario de eventos
  • Educooperando
Espacio principalEspacio secundario

Pequeños modelos de lenguaje: 10 Tecnologías Emergentes 2025

por RedaccionA mayo 7, 2025
mayo 7, 2025
278
De este ARTÍCULO eres el lector: 21

Por: Will Douglas Heaven. 07/05/2025

Los grandes modelos lingüísticos desataron el poder de la IA. Ahora es el momento de hacer más con menos 

QUIÉNES: Instituto Allen de Inteligencia Artificial, Anthropic, Google, Meta, Microsoft, OpenAI. 

CUÁNDO: Ahora. 

No nos confundamos: en el mundo de la IA, el tamaño importa. Cuando OpenAI lanzó GPT-3 allá por 2020, era el modelo lingüístico más grande jamás construido. La empresa demostró que bastaba con aumentar el tamaño de este tipo de modelo para que el rendimiento se disparara. Esto dio lugar a un boom tecnológico que se ha mantenido gracias a modelos cada vez más grandes desde entonces. Como dijo Noam Brown, investigador científico de OpenAI, ante el público de TEDAI San Francisco en octubre, «el increíble progreso de la IA en los últimos cinco años puede resumirse en una sola palabra: escala». 

Pero a medida que las ganancias marginales que logran estos modelos más y más grandes son cada vez menores, los investigadores están descubriendo cómo hacer más con menos. Para determinadas tareas, los modelos modelos de lenguaje reducidos (SML, por las siglas en inglés de small language models) que se entrenan con conjuntos de datos más específicos pueden rendir tan bien como los grandes o incluso mejor. Esto supone una gran ventaja para las empresas deseosas de desplegar la IA para un puñado de aspectos específicos. No hace falta tener todo Internet en el modelo para responder al mismo tipo de petición una y otra vez. 

OpenAI ofrece GPT-4o y GPT-4o mini; Google DeepMind tiene Gemini Ultra y Gemini Nano; y Claude 3, de Anthropic, está disponible en tres tamaños: Opus, Sonnet y Haiku. Microsoft es pionera en una gama de pequeños modelos de lenguaje llamados Phi. 

Cada vez son más las empresas de menor tamaño que también ofrecen modelos pequeños. La empresa de inteligencia artificial Writer afirma que su último modelo lingüístico iguala el rendimiento de los modelos más grandes de primer nivel en muchos parámetros clave, a pesar de que en algunos casos sólo tiene la vigésima parte de parámetros (los valores que se calculan durante el entrenamiento y determinan cómo se comporta un modelo). 

Los modelos más pequeños son más eficientes, por lo que son más rápidos de entrenar y ejecutar. Es una buena noticia también para quienes están preocupados por el clima: como los modelos más pequeños funcionan con una fracción de la potencia que requieren sus primos gigantes, consumen menos energía. 

Estos pequeños modelos también viajan bien: pueden funcionar directamente en nuestros bolsillos, sin necesidad de enviar peticiones a la nube. Lo pequeño es lo próximo.  

LEER EL ARTÍCULO ORIGINAL PULSANDO AQUÍ

Fotografía: Technology review

Compartir 0 FacebookTwitterWhatsapp
RedaccionA

noticia anterior
Suspenden fallo de jueza y orden de aprehensión contra Evo Morales sigue vigente
noticia siguiente
Wifi en la Amazonía: el dilema de la conectividad

También le podría interesar

El cerebro sin órganos de la inteligencia artificial

julio 6, 2025

Cloudflare hace historia bloqueando las consultas de las...

julio 6, 2025

Ciberpatrullaje: colonialismo de datos

julio 5, 2025

Visitantes en este momento:

781 Usuarios En linea
Usuarios: 318 Invitados,463 Bots

Síguenos en nuestras Redes Sociales

  • Bluesky
  • Mastodon
  • Telegram
  • WhatsApp

Blog: Perspectivas comunistas

Gracias por informarte con nosotros…

Desde el Plantón magisterial en el Zócalo de la CDMX

Rompe el cerco informativo…

Blog de la Columna CORTOCIRCUITOS

Nuestros grupos de difusión

Artículos publicados por mes

Síguenos en Facebook

Síguenos en Facebook

Artículos por AUTORES

Artículos publicados por FECHA

julio 2025
L M X J V S D
 123456
78910111213
14151617181920
21222324252627
28293031  
« Jun    

Artículos más leídos esta semana

  • 1

    Tras descuento, maestra de la CNTE recibe $0.99 pesos de salario

    julio 4, 2025
  • 2

    ¡TODOS SOMOS ESTEBAN! Efectos de las reformas neoliberales en el trabajo docente

    julio 3, 2025
  • ¿Cuáles son los elementos de una historieta?

    febrero 15, 2017
  • 4

    Sección 9 de la CNTE inaugura la biblioteca “Mtro. César Navarro Gallegos”

    julio 6, 2025
  • 5

    Envases que embelesan

    septiembre 7, 2021
  • 6

    Renato Romero: auténtico defensor del territorio, criminalizado.

    julio 6, 2025
  • 7

    “La táctica en las redes es clara: bombardearnos con mercancía estúpida y pesimista para que nada cambie”

    julio 4, 2025
  • 8

    TEMPORADA DE ENGAÑOS

    junio 24, 2025
  • 9

    En Veracruz: Docentes y carreteras, el juego extremo.

    julio 5, 2025
  • 10

    Trump y Cuba: ¿regreso a la guerra fría?

    julio 4, 2025
  • 11

    Represión en la Universidad Ibn Zohr: amenazan con expulsar a estudiantes saharauis por manifestarse por la independencia

    julio 3, 2025
  • 12

    UN MISTERIO Y UNA EPIFANÍA DE DUSSEL.

    julio 1, 2025
  • 13

    El fascismo engendra revoluciones

    julio 6, 2025
  • 14

    Acercamiento a FAUSTO de Johann Wolfgang von Goethe

    junio 30, 2025

Rolando Revagliatti. Argentina

Raúl Allain. Perú

Juan Antonio Guerrero O. México

Vanesa Monserrat. Argentina

Carolina Vásquez Araya

Ilka Oliva-Corado

Javier Tolcachier

Columna: CORTOCIRCUITOS

Manuel I. Cabezas González

Luis Armando González

Iliana Lo Priore

Jorge Salazar

Adolfo del Ángel Rodríguez

Oswualdo Antonio G.

José Eduardo Celis

Daniel Suárez

Güris J. Fry

Jorge Díaz Piña

Ángel Santiago Villalobos

Andrés Brenner

Alejandra Cortina

José Carlos Buenaventura

Luis Palacios

@2020 - Insurgencia Magisterial

Portal Insurgencia Magisterial
  • Inicio
  • Nosotros/Legal
  • Directorio
  • Alianzas
  • Columnistas
  • Voces que seguimos
  • Calendario de eventos
  • Educooperando
Portal Insurgencia Magisterial
  • Inicio
  • Nosotros/Legal
  • Directorio
  • Alianzas
  • Columnistas
  • Voces que seguimos
  • Calendario de eventos
  • Educooperando
@2020 - Insurgencia Magisterial

Leer también:x

Betikre Metuktire: tecnologías para defender la Amazonía...

octubre 27, 2022

Por qué proteger el protocolo de Bluesky...

mayo 9, 2025

Experto en nuevas tecnologías: “El capitalismo digital...

abril 2, 2018