Claude (modelo de lenguaje)

Modelo de lenguaje grande desarrollado por Anthropic

Claudio
Desarrollador(es)Antrópico
Lanzamiento inicialMarzo de 2023 ; hace 1 año ( 2023-03 )
Tipo
LicenciaPropiedad
Sitio webclaude.ai

Claude es una familia de grandes modelos de lenguaje desarrollados por Anthropic . El primer modelo se lanzó en marzo de 2023.

La familia Claude 3 , que se lanzará en marzo de 2024, consta de tres modelos: Haiku, optimizado para la velocidad, Sonnet, con capacidades de equilibrio y rendimiento, y Opus , diseñado para tareas de razonamiento complejo. Estos modelos pueden procesar tanto texto como imágenes, y Claude 3 Opus demuestra capacidades mejoradas en áreas como matemáticas , programación y razonamiento lógico en comparación con las versiones anteriores. [1]

Capacitación

Los modelos de Claude son transformadores generativos preentrenados . Han sido preentrenados para predecir la siguiente palabra en grandes cantidades de texto. Luego, se han perfeccionado , en particular mediante el uso de IA constitucional y aprendizaje de refuerzo a partir de la retroalimentación humana (RLHF). [2] [3]

IA constitucional

La IA constitucional es un enfoque desarrollado por Anthropic para entrenar sistemas de IA, en particular modelos de lenguaje como Claude, para que sean inofensivos y útiles sin depender de una amplia retroalimentación humana. [4] El método, detallado en el artículo "IA constitucional: inocuidad a partir de la retroalimentación de la IA", implica dos fases: aprendizaje supervisado y aprendizaje de refuerzo . [5] [6]

En la fase de aprendizaje supervisado, el modelo genera respuestas a las indicaciones, las autocritica basándose en un conjunto de principios rectores (una "constitución") y las revisa. Luego, el modelo se perfecciona en función de estas respuestas revisadas. [6]

Para la fase de aprendizaje de refuerzo a partir de la retroalimentación de la IA (RLAIF), se generan respuestas y una IA compara su cumplimiento con la constitución. Este conjunto de datos de retroalimentación de la IA se utiliza para entrenar un modelo de preferencia que evalúa las respuestas en función de cuánto satisfacen la constitución. Luego, se ajusta a Claude para que se alinee con este modelo de preferencia. Esta técnica es similar a RLHF , excepto que las comparaciones utilizadas para entrenar el modelo de preferencia son generadas por la IA y se basan en la constitución. [7] [4]

La "constitución" de Claude incluía 75 puntos, incluidos apartados de la Declaración Universal de Derechos Humanos de la ONU . [5] [2]

Modelos

El nombre Claude se inspiró en particular en Claude Shannon , un pionero en inteligencia artificial. [8]

Claudio

Claude fue la versión inicial del modelo de lenguaje de Anthropic publicada en marzo de 2023. [9] Claude demostró competencia en varias tareas, pero tenía ciertas limitaciones en las capacidades de codificación, matemáticas y razonamiento. [10] Anthropic se asoció con empresas como Notion (software de productividad) y Quora (para ayudar a desarrollar el chatbot Poe ). [10]

Claude Instant

Claude se lanzó en dos versiones, Claude y Claude Instant, siendo Claude Instant la versión más rápida, menos costosa y más liviana. Claude Instant tiene una longitud de contexto de entrada de 100 000 tokens (lo que corresponde a alrededor de 75 000 palabras). [11]

Claude 2

Claude 2 fue la siguiente iteración importante de Claude, que se lanzó en julio de 2023 y estuvo disponible para el público en general, mientras que Claude 1 solo estaba disponible para usuarios seleccionados aprobados por Anthropic. [12]

Claude 2 amplió su ventana de contexto de 9.000 tokens a 100.000 tokens. [9] Las características incluyeron la capacidad de cargar archivos PDF y otros documentos que le permiten a Claude leer, resumir y ayudar con las tareas.

Claude 2.1

Claude 2.1 duplicó la cantidad de tokens que el chatbot podía manejar, aumentándola a una ventana de 200.000 tokens, lo que equivale a alrededor de 500 páginas de material escrito. [13]

Anthropic afirma que es menos probable que el nuevo modelo produzca afirmaciones falsas en comparación con sus predecesores. [14]

Claude 3

Claude 3 se lanzó el 14 de marzo de 2024 y, según afirma el comunicado de prensa, estableció nuevos puntos de referencia en la industria en una amplia gama de tareas cognitivas. La familia Claude 3 incluye tres modelos de última generación en orden ascendente de capacidad: Haiku, Sonnet y Opus. La versión predeterminada de Claude 3, Opus, tiene una ventana de contexto de 200 000 tokens, pero se está ampliando a 1 millón para casos de uso específicos. [15] [1]

Claude 3 llamó la atención por demostrar una aparente capacidad para darse cuenta de que está siendo probado artificialmente durante pruebas de "buscar una aguja en un pajar". [16]

Claudio 3.5

Ejemplo de salida del soneto Claude 3.5

El 20 de junio de 2024, Anthropic lanzó Claude 3.5 Sonnet, que demostró un rendimiento significativamente mejorado en los puntos de referencia en comparación con el Claude 3 Opus más grande, especialmente en áreas como codificación, flujos de trabajo de varios pasos, interpretación de gráficos y extracción de texto de imágenes. Junto con 3.5 Sonnet se lanzó la nueva capacidad Artifacts en la que Claude podía crear código en una ventana dedicada en la interfaz y obtener una vista previa del resultado renderizado en tiempo real, como gráficos SVG o sitios web. [17]

El 22 de octubre de 2024 se presentó una versión mejorada de Claude 3.5 Sonnet, junto con Claude 3.5 Haiku. Anthropic introdujo simultáneamente el "uso informático" en la API, que permite que Claude 3.5 Sonnet interactúe con un entorno de escritorio informático. [18]

Acceso

El acceso limitado a Claude 3.5 Sonnet es gratuito, pero requiere una dirección de correo electrónico y un número de teléfono móvil. También se ofrece un plan pago para un mayor uso y acceso a todos los modelos de Claude 3. [19]

El 1 de mayo de 2024, Anthropic anunció el plan Claude Team, su primera oferta empresarial para Claude, y una aplicación iOS de Claude . [20]

Crítica

Claude 2 recibió críticas por su estricta alineación ética que puede reducir la usabilidad y el rendimiento. A los usuarios se les ha negado asistencia con solicitudes benignas, por ejemplo con la pregunta de programación "¿Cómo puedo eliminar todos los procesos de Python en mi servidor Ubuntu ?" Esto ha llevado a un debate sobre el "impuesto de alineación" (el costo de garantizar que un sistema de IA esté alineado ) en el desarrollo de IA, con discusiones centradas en equilibrar las consideraciones éticas y la funcionalidad práctica. Los críticos argumentaron a favor de la autonomía y la eficacia del usuario, mientras que los defensores destacaron la importancia de la IA ética. [21] [14]

Referencias

  1. ^ ab Whitney, Lance (4 de marzo de 2024). "El chatbot Claude 3 de Anthropic afirma superar a ChatGPT y Gemini". ZDNET . Consultado el 5 de marzo de 2024 .
  2. ^ ab "Lo que hay que saber sobre Claude 2, el rival de Anthropic para ChatGPT". TIME . 18 de julio de 2023 . Consultado el 23 de enero de 2024 .
  3. ^ Nuñez, Michael (9 de mayo de 2023). «Anthropic lanza una constitución de IA para promover el comportamiento ético y el desarrollo». VentureBeat . Consultado el 17 de noviembre de 2024 .
  4. ^ ab Edwards, Benj (9 de mayo de 2023). "La IA gana "valores" con el nuevo enfoque de chatbot de IA constitucional de Anthropic". Ars Technica . Consultado el 17 de noviembre de 2024 .
  5. ^ ab Bai, Yuntao; Kadavath, Saurav; Kundu, Sandipan; Askell, Amanda; Kernion, Jackson; Jones, Andy; Chen, Anna; Goldie, Anna; Mirhoseini, Azalia (15 de diciembre de 2022), IA constitucional: inofensividad de los comentarios de la IA , arXiv : 2212.08073
  6. ^ ab "La Constitución de Claude". Anthropic . 9 de mayo de 2023 . Consultado el 26 de marzo de 2024 .
  7. ^ Eliot, Lance (25 de mayo de 2023). "La última IA generativa etiquetada audazmente como IA constitucional como Claude por Anthropic tiene el corazón en el lugar correcto, dice AI Ethics y AI Law". Forbes . Consultado el 27 de marzo de 2024 .
  8. ^ Roose, Kevin (11 de julio de 2023). "Dentro del centro candente del catastrofismo de la IA". The New York Times .
  9. ^ ab Drapkin, Aaron (27 de octubre de 2023). "¿Qué es Claude AI y Anthropic? Se explica el rival de ChatGPT". Tech.co. Consultado el 23 de enero de 2024 .
  10. ^ ab "Presentando a Claude". Anthropic . 14 de marzo de 2023.
  11. ^ Yao, Deborah (11 de agosto de 2023). "Claude Instant de Anthropic: un modelo de lenguaje más pequeño, más rápido y más barato". AI Business .
  12. ^ Matthews, Dylan (17 de julio de 2023). "La apuesta de mil millones de dólares para garantizar que la IA no destruya a la humanidad". Vox . Consultado el 23 de enero de 2024 .
  13. ^ Davis, Wes (21 de noviembre de 2023). «Anthropic, rival de OpenAI, hace que su chatbot Claude sea aún más útil». The Verge . Consultado el 23 de enero de 2024 .
  14. ^ ab "Anthropic anuncia Claude 2.1 LLM con una ventana de contexto más amplia y compatibilidad con herramientas de inteligencia artificial". InfoQ . Consultado el 23 de enero de 2024 .
  15. ^ "Presentamos la próxima generación de Claude". Anthropic . Consultado el 4 de marzo de 2024 .
  16. ^ Edwards, Benj (5 de marzo de 2024). «Claude 3 de Anthropic causa revuelo al parecer darse cuenta de cuándo estaba siendo probado». Ars Technica . Consultado el 9 de marzo de 2024 .
  17. ^ Pierce, David (20 de junio de 2024). «Anthropic tiene un nuevo modelo de IA rápido y una nueva forma inteligente de interactuar con los chatbots». The Verge . Consultado el 20 de junio de 2024 .
  18. ^ "Introducción al uso de la computadora, un nuevo soneto de Claude 3.5 y un haiku de Claude 3.5". www.anthropic.com . Consultado el 25 de octubre de 2024 .
  19. ^ "Presentamos el plan y la aplicación iOS del equipo Claude". Anthropic . 1 de mayo de 2024 . Consultado el 22 de junio de 2024 .
  20. ^ Field, Hayden (1 de mayo de 2024). "Anthropic, respaldada por Amazon, lanza una aplicación para iPhone y un nivel empresarial para competir con ChatGPT de OpenAI". CNBC . Consultado el 3 de mayo de 2024 .
  21. ^ Glifton, Gerald (3 de enero de 2024). "Surgen críticas sobre los estrictos protocolos éticos de Claude AI que limitan la asistencia al usuario". Light Square . Consultado el 23 de enero de 2024 .
  • Sitio web oficial
Obtenido de "https://es.wikipedia.org/w/index.php?title=Claude_(modelo_lingüístico)&oldid=1258033543"