Unleash the full potential of your business in the digital world


Por qué los desarrolladores están acudiendo en masa a LLaMA, el LLM de código abierto de Meta.

James Huang | 2023.05.09

En cuanto a la inteligencia artificial generativa, la comunidad de código abierto ha adoptado LLaMA (Large Language Model Meta AI) de Meta AI, que fue lanzada en febrero. Meta puso LLaMA a disposición en varios tamaños (7B, 13B, 33B y 65B de parámetros), pero al principio estaba restringido a investigadores y organizaciones aprobados. Sin embargo, cuando se filtró en línea a principios de marzo para que cualquiera lo descargara, efectivamente se convirtió en código abierto completo. Los desarrolladores se sienten atraídos por LLaMA de Meta porque, a diferencia de GPT y otros LLM populares, los pesos de LLaMA se pueden ajustar con precisión. Esto permite a los desarrolladores crear interacciones de lenguaje avanzado y natural con los usuarios, en aplicaciones como chatbots y asistentes virtuales. LLaMA no es muy diferente del modelo GPT 3 de OpenAI, excepto que Meta ha compartido los pesos. Los otros LLM importantes no han hecho eso. En el contexto de los modelos de IA, "pesos" se refiere a los parámetros aprendidos por un modelo durante el proceso de entrenamiento. Estos parámetros se almacenan en un archivo y se usan durante la fase de inferencia o predicción. Lo que hizo Meta específicamente fue publicar los pesos del modelo LLaMA a la comunidad de investigación bajo una licencia no comercial. Otros LLM poderosos, como GPT, suelen ser accesibles solo a través de APIs limitadas. Debe pasar por OpenAI y acceder a la API, pero en realidad no puede descargar el modelo ni ejecutarlo en su computadora, no puede hacer nada personalizado, básicamente. En otras palabras, LLaMA es mucho más adaptable para los desarrolladores. Esto es potencialmente muy disruptivo para los líderes actuales en LLM, como OpenAI y Google. Los casos de uso de finanzas y legales son buenos candidatos para el ajuste fino y el alojamiento local. Algunas empresas más grandes pueden querer ir más allá del simple ajuste fino y, en su lugar, preentrenar todo el modelo utilizando sus propios datos. Las tareas de clasificación también son populares hasta ahora, como la predicción de toxicidad, la clasificación de spam y la clasificación de satisfacción del cliente. Una de las herramientas que los desarrolladores pueden usar para ajustar finamente LLaMA es LoRA (Adaptación de baja clasificación de modelos de lenguaje grandes). El método adaptador es atractivo porque permite el entrenamiento de todo el LLM, mientras que el resto del transformador permanece congelado, lo que resulta en parámetros más pequeños y un tiempo de entrenamiento más rápido. LoRA es un tipo de método adaptador y utiliza un truco matemático para descomponer matrices grandes en matrices más pequeñas, lo que resulta en menos parámetros y una mayor eficiencia de almacenamiento. En efecto, esto significa que puede hacer el ajuste fino en un tiempo mucho más rápido. Comprender cómo usar modelos de lenguaje será una habilidad útil para los desarrolladores, pero no es necesario que estén a cargo de ajustar finamente los modelos en su empresa a menos que tengan necesidades muy específicas. Para las pequeñas empresas sin información confidencial, pueden usar una herramienta general como GPT, y para las empresas más grandes habrá un miembro del equipo a cargo de ajustar finamente los modelos. En conclusión, LLaMA parece ser una gran opción para los desarrolladores que desean más flexibilidad en el uso de grandes modelos de lenguaje. Si bien el ajuste fino se está volviendo cada vez más accesible, sigue siendo una habilidad especializada que no es necesaria para que cada desarrollador la aprenda. Independientemente de si realizan o no el ajuste fino, los desarrolladores cada vez necesitan entender cómo usar LLM para mejorar ciertas tareas y flujos de trabajo en sus aplicaciones. Por lo tanto, vale la pena echar un vistazo a LLaMA, especialmente porque es más abierto que GPT y otros LLM populares.

Por qué los desarrolladores están acudiendo en masa a LLaMA, el LLM de código abierto de Meta.
MERCURY TECHNOLOGY SOLUTION, James Huang 9 mayo, 2023
Compartir
Malcolm Gladwell: La verdadera razón por la que David vence a Goliat.