From 10145facda9139d850cf1cc077f3d4bf6e9d5fc4 Mon Sep 17 00:00:00 2001 From: Arvin Xu Date: Wed, 25 Sep 2024 03:14:36 +0800 Subject: [PATCH] =?UTF-8?q?=F0=9F=92=84=20style:=20add=20google=20gemini?= =?UTF-8?q?=201.5=20002=20series=20(#4118)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit * 💄 style: add gemini 1.5 002 series * 💄 style: update i18n * ⚡️ perf: improve tools calling and system role for Gemini * ✅ test: add tests for google --- locales/ar/models.json | 12 +++ locales/bg-BG/models.json | 12 +++ locales/de-DE/models.json | 12 +++ locales/en-US/models.json | 12 +++ locales/es-ES/models.json | 12 +++ locales/fr-FR/models.json | 12 +++ locales/it-IT/models.json | 12 +++ locales/ja-JP/models.json | 12 +++ locales/ko-KR/models.json | 12 +++ locales/nl-NL/models.json | 12 +++ locales/pl-PL/models.json | 12 +++ locales/pt-BR/models.json | 12 +++ locales/ru-RU/models.json | 12 +++ locales/tr-TR/models.json | 12 +++ locales/vi-VN/models.json | 12 +++ locales/zh-CN/models.json | 14 ++- locales/zh-TW/models.json | 12 +++ src/config/modelProviders/google.ts | 56 ++++++++++- src/libs/agent-runtime/google/index.test.ts | 104 +++++++++++++++++++- src/libs/agent-runtime/google/index.ts | 88 +++++++++++------ 20 files changed, 416 insertions(+), 38 deletions(-) diff --git a/locales/ar/models.json b/locales/ar/models.json index 3df9ff42bbe9..2173242ffb95 100644 --- a/locales/ar/models.json +++ b/locales/ar/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 هو نموذج متعدد الوسائط فعال، يدعم التوسع في التطبيقات الواسعة." }, + "gemini-1.5-flash-002": { + "description": "جمني 1.5 فلاش 002 هو نموذج متعدد الوسائط فعال، يدعم توسيع التطبيقات على نطاق واسع." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 مصمم لمعالجة سيناريوهات المهام الكبيرة، ويوفر سرعة معالجة لا مثيل لها." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "جمني 1.5 فلاش 8B 0924 هو النموذج التجريبي الأحدث، حيث حقق تحسينات ملحوظة في الأداء في حالات الاستخدام النصية ومتعددة الوسائط." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 يوفر قدرات معالجة متعددة الوسائط محسّنة، مناسبة لمجموعة متنوعة من سيناريوهات المهام المعقدة." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 هو حل ذكاء اصطناعي متعدد الوسائط قابل للتوسع، يدعم مجموعة واسعة من المهام المعقدة." }, + "gemini-1.5-pro-002": { + "description": "جمني 1.5 برو 002 هو النموذج الأحدث الجاهز للإنتاج، حيث يقدم مخرجات ذات جودة أعلى، مع تحسينات ملحوظة خاصة في الرياضيات والسياقات الطويلة والمهام البصرية." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 يوفر قدرات معالجة متعددة الوسائط ممتازة، مما يوفر مرونة أكبر لتطوير التطبيقات." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "نموذج اللغة الكبير TaiChu يتمتع بقدرات قوية في فهم اللغة، بالإضافة إلى إنشاء النصوص، والإجابة على الأسئلة، وبرمجة الأكواد، والحسابات الرياضية، والاستدلال المنطقي، وتحليل المشاعر، وتلخيص النصوص. يجمع بشكل مبتكر بين التدريب المسبق على البيانات الضخمة والمعرفة الغنية من مصادر متعددة، من خلال تحسين تقنيات الخوارزميات باستمرار واستيعاب المعرفة الجديدة من البيانات النصية الضخمة، مما يحقق تطورًا مستمرًا في أداء النموذج. يوفر للمستخدمين معلومات وخدمات أكثر سهولة وتجربة أكثر ذكاءً." }, + "taichu_vqa": { + "description": "تايتشو 2.0V يجمع بين فهم الصور، ونقل المعرفة، والاستدلال المنطقي، ويظهر أداءً بارزًا في مجال الأسئلة والأجوبة النصية والصورية." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) يوفر قدرة حسابية معززة من خلال استراتيجيات فعالة وهندسة نموذجية." }, diff --git a/locales/bg-BG/models.json b/locales/bg-BG/models.json index b5aaf88daa04..4f40d01f6a79 100644 --- a/locales/bg-BG/models.json +++ b/locales/bg-BG/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 е ефективен многомодален модел, който поддържа разширяване на широк спектър от приложения." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 е ефективен мултимодален модел, който поддържа разширения за широко приложение." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 е проектиран за обработка на мащабни задачи, предлагащ ненадмината скорост на обработка." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 е най-новият експериментален модел, който показва значителни подобрения в производителността както в текстови, така и в мултимодални приложения." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 предлага оптимизирани многомодални обработващи способности, подходящи за множество сложни задачи." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 е разширяемо многомодално AI решение, което поддържа широк спектър от сложни задачи." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 е най-новият модел, готов за производство, който предлага по-високо качество на изхода, особено в математически, дълги контексти и визуални задачи." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 предлага отлични способности за обработка на многомодални данни, предоставяйки по-голяма гъвкавост за разработка на приложения." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "Моделът на езика TaiChu е с изключителни способности за разбиране на езика, текстово генериране, отговори на знания, програмиране, математически изчисления, логическо разсъждение, анализ на емоции, резюмиране на текст и др. Иновативно комбинира предварително обучение с големи данни и разнообразни източници на знания, чрез непрекъснато усъвършенстване на алгоритмичните технологии и усвояване на нови знания от масивни текстови данни, за да осигури на потребителите по-удобна информация и услуги, както и по-интелигентно изживяване." }, + "taichu_vqa": { + "description": "Taichu 2.0V обединява способности за разбиране на изображения, прехвърляне на знания, логическо обяснение и др., и се представя отлично в областта на въпросите и отговорите на текст и изображения." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) предлага подобрена изчислителна мощ чрез ефективни стратегии и архитектура на модела." }, diff --git a/locales/de-DE/models.json b/locales/de-DE/models.json index a567f53bfe0b..bfa79a82e2dc 100644 --- a/locales/de-DE/models.json +++ b/locales/de-DE/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 ist ein effizientes multimodales Modell, das eine breite Anwendbarkeit unterstützt." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 ist ein effizientes multimodales Modell, das eine breite Palette von Anwendungen unterstützt." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 ist für die Verarbeitung großangelegter Aufgabenszenarien konzipiert und bietet unvergleichliche Verarbeitungsgeschwindigkeit." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 ist das neueste experimentelle Modell, das in Text- und multimodalen Anwendungsfällen erhebliche Leistungsverbesserungen aufweist." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 bietet optimierte multimodale Verarbeitungsfähigkeiten, die für verschiedene komplexe Aufgabenszenarien geeignet sind." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 ist eine skalierbare multimodale KI-Lösung, die eine breite Palette komplexer Aufgaben unterstützt." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 ist das neueste produktionsbereite Modell, das eine höhere Ausgabequalität bietet, insbesondere bei mathematischen, langen Kontexten und visuellen Aufgaben erhebliche Verbesserungen aufweist." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 bietet hervorragende multimodale Verarbeitungsfähigkeiten und bringt mehr Flexibilität in die Anwendungsentwicklung." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "Das Zīdōng Taichu Sprachmodell verfügt über außergewöhnliche Sprachverständnisfähigkeiten sowie Fähigkeiten in Textgenerierung, Wissensabfrage, Programmierung, mathematischen Berechnungen, logischem Denken, Sentimentanalyse und Textzusammenfassung. Es kombiniert innovativ große Datenvortrainings mit reichhaltigem Wissen aus mehreren Quellen, verfeinert kontinuierlich die Algorithmen und absorbiert ständig neues Wissen aus umfangreichen Textdaten in Bezug auf Vokabular, Struktur, Grammatik und Semantik, um die Leistung des Modells kontinuierlich zu verbessern. Es bietet den Nutzern bequemere Informationen und Dienstleistungen sowie ein intelligenteres Erlebnis." }, + "taichu_vqa": { + "description": "Taichu 2.0V vereint Fähigkeiten wie Bildverständnis, Wissensübertragung und logische Attribution und zeigt herausragende Leistungen im Bereich der Bild-Text-Fragen." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) bietet durch effiziente Strategien und Modellarchitekturen verbesserte Rechenfähigkeiten." }, diff --git a/locales/en-US/models.json b/locales/en-US/models.json index e0206c69d640..46161be50607 100644 --- a/locales/en-US/models.json +++ b/locales/en-US/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 is an efficient multimodal model that supports extensive application scaling." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 is an efficient multimodal model that supports a wide range of applications." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 is designed for handling large-scale task scenarios, providing unparalleled processing speed." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 is the latest experimental model, showcasing significant performance improvements in both text and multimodal use cases." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 offers optimized multimodal processing capabilities, suitable for a variety of complex task scenarios." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 is a scalable multimodal AI solution that supports a wide range of complex tasks." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 is the latest production-ready model, delivering higher quality outputs, with notable enhancements in mathematics, long-context, and visual tasks." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 offers excellent multimodal processing capabilities, providing greater flexibility for application development." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "The ZD Taichu language model possesses strong language understanding capabilities and excels in text creation, knowledge Q&A, code programming, mathematical calculations, logical reasoning, sentiment analysis, and text summarization. It innovatively combines large-scale pre-training with rich knowledge from multiple sources, continuously refining algorithmic techniques and absorbing new knowledge in vocabulary, structure, grammar, and semantics from vast text data, resulting in an evolving model performance. It provides users with more convenient information and services, as well as a more intelligent experience." }, + "taichu_vqa": { + "description": "Taichu 2.0V integrates capabilities such as image understanding, knowledge transfer, and logical reasoning, excelling in the field of image-text question answering." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) provides enhanced computational capabilities through efficient strategies and model architecture." }, diff --git a/locales/es-ES/models.json b/locales/es-ES/models.json index 66a35accd420..f6d8cee71dc1 100644 --- a/locales/es-ES/models.json +++ b/locales/es-ES/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 es un modelo multimodal eficiente, que admite la escalabilidad para aplicaciones amplias." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 es un modelo multimodal eficiente, que admite una amplia gama de aplicaciones." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 está diseñado para manejar escenarios de tareas a gran escala, ofreciendo una velocidad de procesamiento inigualable." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 es el último modelo experimental, con mejoras significativas en el rendimiento tanto en casos de uso de texto como multimodal." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 ofrece capacidades de procesamiento multimodal optimizadas, adecuadas para una variedad de escenarios de tareas complejas." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 es una solución de IA multimodal escalable, que admite una amplia gama de tareas complejas." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 es el último modelo listo para producción, que ofrece una calidad de salida superior, especialmente en tareas matemáticas, contextos largos y tareas visuales." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 ofrece una excelente capacidad de procesamiento multimodal, brindando mayor flexibilidad para el desarrollo de aplicaciones." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "El modelo de lenguaje Taichu de Zīdōng tiene una poderosa capacidad de comprensión del lenguaje, así como habilidades en creación de textos, preguntas y respuestas, programación de código, cálculos matemáticos, razonamiento lógico, análisis de sentimientos y resúmenes de texto. Combina de manera innovadora el preentrenamiento con grandes datos y un conocimiento rico de múltiples fuentes, perfeccionando continuamente la tecnología algorítmica y absorbiendo nuevos conocimientos en vocabulario, estructura, gramática y semántica de grandes volúmenes de datos textuales, logrando una evolución constante del modelo. Proporciona a los usuarios información y servicios más convenientes, así como una experiencia más inteligente." }, + "taichu_vqa": { + "description": "Taichu 2.0V combina capacidades de comprensión de imágenes, transferencia de conocimiento y atribución lógica, destacándose en el campo de preguntas y respuestas basadas en texto e imagen." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) proporciona una capacidad de cálculo mejorada a través de estrategias y arquitecturas de modelos eficientes." }, diff --git a/locales/fr-FR/models.json b/locales/fr-FR/models.json index 94ce0e38ae6c..73147b23211b 100644 --- a/locales/fr-FR/models.json +++ b/locales/fr-FR/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 est un modèle multimodal efficace, prenant en charge l'extension d'applications variées." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 est un modèle multimodal efficace, prenant en charge une large gamme d'applications." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 est conçu pour traiter des scénarios de tâches à grande échelle, offrant une vitesse de traitement inégalée." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 est le dernier modèle expérimental, offrant des améliorations significatives en termes de performance dans les cas d'utilisation textuels et multimodaux." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 offre des capacités de traitement multimodal optimisées, adaptées à divers scénarios de tâches complexes." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 est une solution d'IA multimodale extensible, prenant en charge une large gamme de tâches complexes." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 est le dernier modèle prêt pour la production, offrant une qualité de sortie supérieure, avec des améliorations notables dans les domaines des mathématiques, des contextes longs et des tâches visuelles." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 offre d'excellentes capacités de traitement multimodal, apportant une plus grande flexibilité au développement d'applications." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "Le modèle de langage Taichu Zidong possède une forte capacité de compréhension linguistique ainsi que des compétences en création de texte, questions-réponses, programmation, calcul mathématique, raisonnement logique, analyse des sentiments, et résumé de texte. Il combine de manière innovante le pré-entraînement sur de grandes données avec des connaissances riches provenant de multiples sources, en perfectionnant continuellement la technologie algorithmique et en intégrant de nouvelles connaissances sur le vocabulaire, la structure, la grammaire et le sens à partir de vastes ensembles de données textuelles, offrant aux utilisateurs des informations et des services plus pratiques ainsi qu'une expérience plus intelligente." }, + "taichu_vqa": { + "description": "Taichu 2.0V intègre des capacités de compréhension d'image, de transfert de connaissances et d'attribution logique, se distinguant dans le domaine des questions-réponses textuelles et visuelles." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) offre une capacité de calcul améliorée grâce à des stratégies et une architecture de modèle efficaces." }, diff --git a/locales/it-IT/models.json b/locales/it-IT/models.json index 6fa278af0dcb..bc45405a255c 100644 --- a/locales/it-IT/models.json +++ b/locales/it-IT/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 è un modello multimodale efficiente, supporta l'espansione per applicazioni ampie." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 è un modello multimodale altamente efficiente, che supporta un'ampia gamma di applicazioni." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 è progettato per gestire scenari di compiti su larga scala, offrendo una velocità di elaborazione senza pari." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 è il modello sperimentale più recente, con miglioramenti significativi nelle prestazioni sia nei casi d'uso testuali che multimodali." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 offre capacità di elaborazione multimodale ottimizzate, adatte a vari scenari di compiti complessi." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 è una soluzione AI multimodale scalabile, supporta un'ampia gamma di compiti complessi." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 è il modello più recente pronto per la produzione, che offre output di qualità superiore, con miglioramenti significativi in particolare in matematica, contesti lunghi e compiti visivi." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 offre eccellenti capacità di elaborazione multimodale, fornendo maggiore flessibilità per lo sviluppo delle applicazioni." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "Il modello linguistico Taichu di Zīdōng ha una straordinaria capacità di comprensione del linguaggio e abilità in creazione di testi, domande di conoscenza, programmazione, calcoli matematici, ragionamento logico, analisi del sentimento e sintesi di testi. Combina in modo innovativo il pre-addestramento su grandi dati con una ricca conoscenza multi-sorgente, affinando continuamente la tecnologia degli algoritmi e assorbendo costantemente nuove conoscenze da dati testuali massivi, migliorando continuamente le prestazioni del modello. Fornisce agli utenti informazioni e servizi più convenienti e un'esperienza più intelligente." }, + "taichu_vqa": { + "description": "Taichu 2.0V integra capacità di comprensione delle immagini, trasferimento di conoscenze e attribuzione logica, eccellendo nel campo delle domande e risposte basate su testo e immagini." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) offre capacità di calcolo potenziate attraverso strategie e architetture di modelli efficienti." }, diff --git a/locales/ja-JP/models.json b/locales/ja-JP/models.json index 1d087c43aa10..c1a5c3ff20e1 100644 --- a/locales/ja-JP/models.json +++ b/locales/ja-JP/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001は、効率的なマルチモーダルモデルであり、幅広いアプリケーションの拡張をサポートします。" }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002は効率的なマルチモーダルモデルで、幅広いアプリケーションの拡張をサポートしています。" + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827は、大規模なタスクシナリオの処理のために設計されており、比類のない処理速度を提供します。" }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924は最新の実験モデルで、テキストおよびマルチモーダルのユースケースにおいて顕著な性能向上を実現しています。" + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827は、最適化されたマルチモーダル処理能力を提供し、さまざまな複雑なタスクシナリオに適用できます。" }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001は、拡張可能なマルチモーダルAIソリューションであり、幅広い複雑なタスクをサポートします。" }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002は最新の生産準備モデルで、特に数学、長いコンテキスト、視覚タスクにおいて質の高い出力を提供し、顕著な向上を見せています。" + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801は、優れたマルチモーダル処理能力を提供し、アプリケーション開発における柔軟性を高めます。" }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "紫東太初言語大モデルは、強力な言語理解能力とテキスト創作、知識問答、コードプログラミング、数学計算、論理推論、感情分析、テキスト要約などの能力を備えています。革新的に大データの事前学習と多源の豊富な知識を組み合わせ、アルゴリズム技術を継続的に磨き、膨大なテキストデータから語彙、構造、文法、意味などの新しい知識を吸収し、モデルの効果を進化させています。ユーザーにより便利な情報とサービス、よりインテリジェントな体験を提供します。" }, + "taichu_vqa": { + "description": "Taichu 2.0Vは画像理解、知識移転、論理的帰納などの能力を融合させており、テキストと画像の質問応答分野で優れたパフォーマンスを発揮しています。" + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B)は、高効率の戦略とモデルアーキテクチャを通じて、強化された計算能力を提供します。" }, diff --git a/locales/ko-KR/models.json b/locales/ko-KR/models.json index e030352a9196..cf0fd1a2c9a5 100644 --- a/locales/ko-KR/models.json +++ b/locales/ko-KR/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001은 효율적인 다중 모달 모델로, 광범위한 응용 프로그램 확장을 지원합니다." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002는 효율적인 다중 모달 모델로, 광범위한 응용 프로그램의 확장을 지원합니다." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827은 대규모 작업 시나리오 처리를 위해 설계되었으며, 비할 데 없는 처리 속도를 제공합니다." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924는 최신 실험 모델로, 텍스트 및 다중 모달 사용 사례에서 상당한 성능 향상을 보여줍니다." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827은 최적화된 다중 모달 처리 능력을 제공하며, 다양한 복잡한 작업 시나리오에 적합합니다." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001은 확장 가능한 다중 모달 AI 솔루션으로, 광범위한 복잡한 작업을 지원합니다." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002는 최신 생산 준비 모델로, 특히 수학, 긴 문맥 및 시각적 작업에서 더 높은 품질의 출력을 제공합니다." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801은 뛰어난 다중 모달 처리 능력을 제공하여 응용 프로그램 개발에 더 큰 유연성을 제공합니다." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "자이동 태초 언어 대모델은 뛰어난 언어 이해 능력과 텍스트 창작, 지식 질문 응답, 코드 프로그래밍, 수학 계산, 논리 추론, 감정 분석, 텍스트 요약 등의 능력을 갖추고 있습니다. 혁신적으로 대규모 데이터 사전 훈련과 다원적 풍부한 지식을 결합하여 알고리즘 기술을 지속적으로 다듬고, 방대한 텍스트 데이터에서 어휘, 구조, 문법, 의미 등의 새로운 지식을 지속적으로 흡수하여 모델 성능을 지속적으로 진화시킵니다. 사용자에게 보다 편리한 정보와 서비스, 그리고 더 지능적인 경험을 제공합니다." }, + "taichu_vqa": { + "description": "Taichu 2.0V는 이미지 이해, 지식 이전, 논리적 귀속 등의 능력을 통합하여, 텍스트와 이미지 질문 응답 분야에서 뛰어난 성능을 발휘합니다." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B)는 효율적인 전략과 모델 아키텍처를 통해 향상된 계산 능력을 제공합니다." }, diff --git a/locales/nl-NL/models.json b/locales/nl-NL/models.json index 382db10f38c0..fdfccbc3bf8a 100644 --- a/locales/nl-NL/models.json +++ b/locales/nl-NL/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 is een efficiënt multimodaal model dat ondersteuning biedt voor brede toepassingsuitbreiding." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 is een efficiënt multimodaal model dat ondersteuning biedt voor een breed scala aan toepassingen." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 is ontworpen voor het verwerken van grootschalige taakscenario's en biedt ongeëvenaarde verwerkingssnelheid." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 is het nieuwste experimentele model, met aanzienlijke prestatieverbeteringen in tekst- en multimodale toepassingen." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 biedt geoptimaliseerde multimodale verwerkingscapaciteiten, geschikt voor verschillende complexe taakscenario's." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 is een schaalbare multimodale AI-oplossing die ondersteuning biedt voor een breed scala aan complexe taken." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 is het nieuwste productieklare model, dat hogere kwaliteit output biedt, met name op het gebied van wiskunde, lange contexten en visuele taken." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 biedt uitstekende multimodale verwerkingscapaciteiten en biedt meer flexibiliteit voor applicatieontwikkeling." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "Het Zido Tai Chu-taalmodel heeft een sterke taalbegripcapaciteit en kan tekstcreatie, kennisvragen, codeprogrammering, wiskundige berekeningen, logische redenering, sentimentanalyse, tekstsamenvattingen en meer aan. Het combineert innovatief grote data voortraining met rijke kennis uit meerdere bronnen, door algoritmische technologie continu te verfijnen en voortdurend nieuwe kennis op te nemen uit enorme tekstdata op het gebied van vocabulaire, structuur, grammatica en semantiek, waardoor de modelprestaties voortdurend evolueren. Het biedt gebruikers gemakkelijkere informatie en diensten en een meer intelligente ervaring." }, + "taichu_vqa": { + "description": "Taichu 2.0V combineert capaciteiten zoals beeldbegrip, kennisoverdracht en logische toerekening, en presteert uitstekend in het domein van beeld-tekst vraag en antwoord." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) biedt verbeterde rekenkracht door middel van efficiënte strategieën en modelarchitectuur." }, diff --git a/locales/pl-PL/models.json b/locales/pl-PL/models.json index 4e95fb252db3..e0b3870bd5ba 100644 --- a/locales/pl-PL/models.json +++ b/locales/pl-PL/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 to wydajny model multimodalny, wspierający szerokie zastosowania." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 to wydajny model multimodalny, który wspiera szeroką gamę zastosowań." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 został zaprojektowany do obsługi dużych zadań, oferując niezrównaną prędkość przetwarzania." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 to najnowszy eksperymentalny model, który wykazuje znaczące poprawy wydajności w zastosowaniach tekstowych i multimodalnych." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 oferuje zoptymalizowane możliwości przetwarzania multimodalnego, odpowiednie do różnych złożonych scenariuszy zadań." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 to skalowalne rozwiązanie AI multimodalnego, wspierające szeroki zakres złożonych zadań." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 to najnowszy model gotowy do produkcji, oferujący wyższą jakość wyników, ze szczególnym uwzględnieniem zadań matematycznych, długich kontekstów i zadań wizualnych." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 oferuje doskonałe możliwości przetwarzania multimodalnego, zapewniając większą elastyczność w rozwoju aplikacji." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "Model językowy TaiChu charakteryzuje się wyjątkową zdolnością rozumienia języka oraz umiejętnościami w zakresie tworzenia tekstów, odpowiadania na pytania, programowania, obliczeń matematycznych, wnioskowania logicznego, analizy emocji i streszczenia tekstu. Innowacyjnie łączy wstępne uczenie się na dużych zbiorach danych z bogatą wiedzą z wielu źródeł, stale doskonaląc technologię algorytmiczną i nieustannie przyswajając nową wiedzę z zakresu słownictwa, struktury, gramatyki i semantyki z ogromnych zbiorów danych tekstowych, co prowadzi do ciągłej ewolucji modelu. Umożliwia użytkownikom łatwiejszy dostęp do informacji i usług oraz bardziej inteligentne doświadczenia." }, + "taichu_vqa": { + "description": "Taichu 2.0V łączy zdolności rozumienia obrazów, transferu wiedzy i logicznego wnioskowania, osiągając znakomite wyniki w dziedzinie pytań i odpowiedzi na podstawie tekstu i obrazów." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) oferuje zwiększoną moc obliczeniową dzięki efektywnym strategiom i architekturze modelu." }, diff --git a/locales/pt-BR/models.json b/locales/pt-BR/models.json index 67406c4dd7b2..a496c8d96212 100644 --- a/locales/pt-BR/models.json +++ b/locales/pt-BR/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 é um modelo multimodal eficiente, suportando a expansão de aplicações amplas." }, + "gemini-1.5-flash-002": { + "description": "O Gemini 1.5 Flash 002 é um modelo multimodal eficiente, que suporta uma ampla gama de aplicações." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 é projetado para lidar com cenários de tarefas em larga escala, oferecendo velocidade de processamento incomparável." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "O Gemini 1.5 Flash 8B 0924 é o mais recente modelo experimental, com melhorias significativas de desempenho em casos de uso de texto e multimídia." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 oferece capacidade de processamento multimodal otimizada, adequada para uma variedade de cenários de tarefas complexas." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 é uma solução de IA multimodal escalável, suportando uma ampla gama de tarefas complexas." }, + "gemini-1.5-pro-002": { + "description": "O Gemini 1.5 Pro 002 é o mais recente modelo pronto para produção, oferecendo saídas de maior qualidade, com melhorias significativas em tarefas matemáticas, contextos longos e tarefas visuais." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 oferece excelente capacidade de processamento multimodal, proporcionando maior flexibilidade para o desenvolvimento de aplicações." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "O modelo de linguagem Taichu possui uma forte capacidade de compreensão de linguagem, além de habilidades em criação de texto, perguntas e respostas, programação de código, cálculos matemáticos, raciocínio lógico, análise de sentimentos e resumo de texto. Inova ao combinar pré-treinamento com grandes dados e conhecimento rico de múltiplas fontes, aprimorando continuamente a tecnologia de algoritmos e absorvendo novos conhecimentos de vocabulário, estrutura, gramática e semântica de grandes volumes de dados textuais, proporcionando aos usuários informações e serviços mais convenientes e uma experiência mais inteligente." }, + "taichu_vqa": { + "description": "O Taichu 2.0V combina habilidades de compreensão de imagem, transferência de conhecimento e atribuição lógica, destacando-se no campo de perguntas e respostas baseadas em texto e imagem." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) oferece capacidade de computação aprimorada através de estratégias e arquiteturas de modelo eficientes." }, diff --git a/locales/ru-RU/models.json b/locales/ru-RU/models.json index c7c3a997f94c..1f1740c5a1df 100644 --- a/locales/ru-RU/models.json +++ b/locales/ru-RU/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 — это эффективная многомодальная модель, поддерживающая масштабирование для широкого спектра приложений." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 — это эффективная мультимодальная модель, поддерживающая расширенные применения." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 разработан для обработки масштабных задач, обеспечивая непревзойдённую скорость обработки." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 — это последняя экспериментальная модель, которая демонстрирует значительное улучшение производительности как в текстовых, так и в мультимодальных задачах." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 предлагает оптимизированные многомодальные возможности обработки, подходящие для различных сложных задач." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 — это масштабируемое решение для многомодального ИИ, поддерживающее широкий спектр сложных задач." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 — это последняя модель, готовая к производству, которая обеспечивает более высокое качество вывода, особенно в математических задачах, длинных контекстах и визуальных задачах." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 предлагает выдающиеся возможности многомодальной обработки, обеспечивая большую гибкость для разработки приложений." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "Модель языка TaiChu обладает выдающимися способностями к пониманию языка, а также к созданию текстов, ответам на вопросы, программированию, математическим вычислениям, логическому выводу, анализу эмоций и резюмированию текстов. Инновационно сочетает предобучение на больших данных с богатством многопоточных знаний, постоянно совершенствуя алгоритмические технологии и поглощая новые знания о словах, структуре, грамматике и семантике из огромных объемов текстовых данных, обеспечивая пользователям более удобную информацию и услуги, а также более интеллектуальный опыт." }, + "taichu_vqa": { + "description": "Taichu 2.0V объединяет возможности понимания изображений, передачи знаний, логического вывода и других, демонстрируя выдающиеся результаты в области вопросов и ответов на основе текста и изображений." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) обеспечивает повышенные вычислительные возможности благодаря эффективным стратегиям и архитектуре модели." }, diff --git a/locales/tr-TR/models.json b/locales/tr-TR/models.json index 5e02cd32d5fb..3490407b907e 100644 --- a/locales/tr-TR/models.json +++ b/locales/tr-TR/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001, geniş uygulama alanları için destekleyen verimli bir çok modlu modeldir." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002, geniş uygulama yelpazesini destekleyen verimli bir çok modlu modeldir." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827, büyük ölçekli görev senaryolarını işlemek için tasarlanmış, eşsiz bir işleme hızı sunar." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924, metin ve çok modlu kullanım durumlarında önemli performans artışları sunan en son deneysel modeldir." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827, çeşitli karmaşık görev senaryoları için optimize edilmiş çok modlu işleme yeteneği sunar." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001, geniş karmaşık görevleri destekleyen ölçeklenebilir bir çok modlu AI çözümüdür." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002, daha yüksek kaliteli çıktılar sunan en son üretim hazır modeldir; özellikle matematik, uzun bağlam ve görsel görevlerde önemli iyileştirmeler sağlamaktadır." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801, mükemmel çok modlu işleme yeteneği sunar ve uygulama geliştirmeye daha fazla esneklik kazandırır." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "Zidong Taichu dil büyük modeli, güçlü dil anlama yeteneği ile metin oluşturma, bilgi sorgulama, kod programlama, matematik hesaplama, mantıksal akıl yürütme, duygu analizi, metin özeti gibi yeteneklere sahiptir. Yenilikçi bir şekilde büyük veri ön eğitimi ile çok kaynaklı zengin bilgiyi birleştirir, algoritma teknolojisini sürekli olarak geliştirir ve büyük metin verilerinden kelime, yapı, dil bilgisi, anlam gibi yeni bilgileri sürekli olarak edinir, modelin performansını sürekli olarak evrimleştirir. Kullanıcılara daha kolay bilgi ve hizmetler sunar ve daha akıllı bir deneyim sağlar." }, + "taichu_vqa": { + "description": "Taichu 2.0V, görüntü anlama, bilgi aktarımı, mantıksal çıkarım gibi yetenekleri birleştirerek, metin ve görsel soru-cevap alanında öne çıkmaktadır." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B), etkili stratejiler ve model mimarisi ile artırılmış hesaplama yetenekleri sunar." }, diff --git a/locales/vi-VN/models.json b/locales/vi-VN/models.json index d909be084fdd..96bab9d7ee8b 100644 --- a/locales/vi-VN/models.json +++ b/locales/vi-VN/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 là một mô hình đa phương thức hiệu quả, hỗ trợ mở rộng cho nhiều ứng dụng." }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 là một mô hình đa phương thức hiệu quả, hỗ trợ mở rộng cho nhiều ứng dụng." + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 được thiết kế để xử lý các tình huống nhiệm vụ quy mô lớn, cung cấp tốc độ xử lý vô song." }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 là mô hình thử nghiệm mới nhất, có sự cải thiện đáng kể về hiệu suất trong các trường hợp sử dụng văn bản và đa phương thức." + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 cung cấp khả năng xử lý đa phương thức được tối ưu hóa, phù hợp cho nhiều tình huống nhiệm vụ phức tạp." }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 là giải pháp AI đa phương thức có thể mở rộng, hỗ trợ nhiều nhiệm vụ phức tạp." }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 là mô hình sẵn sàng cho sản xuất mới nhất, cung cấp đầu ra chất lượng cao hơn, đặc biệt là trong các nhiệm vụ toán học, ngữ cảnh dài và thị giác." + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 cung cấp khả năng xử lý đa phương thức xuất sắc, mang lại sự linh hoạt lớn hơn cho phát triển ứng dụng." }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "Mô hình ngôn ngữ lớn Taichu có khả năng hiểu ngôn ngữ mạnh mẽ và các khả năng như sáng tạo văn bản, trả lời câu hỏi kiến thức, lập trình mã, tính toán toán học, suy luận logic, phân tích cảm xúc, tóm tắt văn bản. Đổi mới kết hợp giữa đào tạo trước với dữ liệu phong phú từ nhiều nguồn, thông qua việc liên tục cải tiến công nghệ thuật toán và hấp thụ kiến thức mới từ dữ liệu văn bản khổng lồ, giúp mô hình ngày càng hoàn thiện. Cung cấp thông tin và dịch vụ tiện lợi hơn cho người dùng cùng trải nghiệm thông minh hơn." }, + "taichu_vqa": { + "description": "Taichu 2.0V kết hợp khả năng hiểu hình ảnh, chuyển giao kiến thức, suy luận logic, v.v., thể hiện xuất sắc trong lĩnh vực hỏi đáp hình ảnh và văn bản." + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) cung cấp khả năng tính toán nâng cao thông qua chiến lược và kiến trúc mô hình hiệu quả." }, diff --git a/locales/zh-CN/models.json b/locales/zh-CN/models.json index d2850bb66e95..a6f862c8cf50 100644 --- a/locales/zh-CN/models.json +++ b/locales/zh-CN/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 是一款高效的多模态模型,支持广泛应用的扩展。" }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 是一款高效的多模态模型,支持广泛应用的扩展。" + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 专为处理大规模任务场景设计,提供无与伦比的处理速度。" }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 是最新的实验性模型,在文本和多模态用例中都有显著的性能提升。" + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 提供了优化后的多模态处理能力,适用多种复杂任务场景。" }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 是可扩展的多模态AI解决方案,支持广泛的复杂任务。" }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 是最新的生产就绪模型,提供更高质量的输出,特别在数学、长上下文和视觉任务方面有显著提升。" + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 提供出色的多模态处理能力,为应用开发带来更大灵活性。" }, @@ -872,7 +881,10 @@ "description": "支持大规模上下文交互,适合复杂对话场景。" }, "taichu_llm": { - "description": "紫东太初语言大模型具备超强语言理解能力以及文本创作、知识问答、代码编程、数学计算、逻辑推理、情感分析、文本摘要等能力。创新性地将大数据预训练与多源丰富知识相结合,通过持续打磨算法技术,并不断吸收海量文本数据中词汇、结构、语法、语义等方面的新知识,实现模型效果不断进化。为用户提供更加便捷的信息和服务以及更为智能化的体验。" + "description": "Taichu 2.0 基于海量高质数据训练,具有更强的文本理解、内容创作、对话问答等能力" + }, + "taichu_vqa": { + "description": "Taichu 2.0V 融合了图像理解、知识迁移、逻辑归因等能力,在图文问答领域表现突出" }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) 通过高效的策略和模型架构,提供增强的计算能力。" diff --git a/locales/zh-TW/models.json b/locales/zh-TW/models.json index 8eb155e2f6a2..7262251e1ed8 100644 --- a/locales/zh-TW/models.json +++ b/locales/zh-TW/models.json @@ -332,9 +332,15 @@ "gemini-1.5-flash-001": { "description": "Gemini 1.5 Flash 001 是一款高效的多模態模型,支持廣泛應用的擴展。" }, + "gemini-1.5-flash-002": { + "description": "Gemini 1.5 Flash 002 是一款高效的多模態模型,支持廣泛應用的擴展。" + }, "gemini-1.5-flash-8b-exp-0827": { "description": "Gemini 1.5 Flash 8B 0827 專為處理大規模任務場景設計,提供無與倫比的處理速度。" }, + "gemini-1.5-flash-8b-exp-0924": { + "description": "Gemini 1.5 Flash 8B 0924 是最新的實驗性模型,在文本和多模態用例中都有顯著的性能提升。" + }, "gemini-1.5-flash-exp-0827": { "description": "Gemini 1.5 Flash 0827 提供了優化後的多模態處理能力,適用多種複雜任務場景。" }, @@ -344,6 +350,9 @@ "gemini-1.5-pro-001": { "description": "Gemini 1.5 Pro 001 是可擴展的多模態 AI 解決方案,支持廣泛的複雜任務。" }, + "gemini-1.5-pro-002": { + "description": "Gemini 1.5 Pro 002 是最新的生產就緒模型,提供更高品質的輸出,特別在數學、長上下文和視覺任務方面有顯著提升。" + }, "gemini-1.5-pro-exp-0801": { "description": "Gemini 1.5 Pro 0801 提供出色的多模態處理能力,為應用開發帶來更大靈活性。" }, @@ -874,6 +883,9 @@ "taichu_llm": { "description": "紫東太初語言大模型具備超強語言理解能力以及文本創作、知識問答、代碼編程、數學計算、邏輯推理、情感分析、文本摘要等能力。創新性地將大數據預訓練與多源豐富知識相結合,通過持續打磨算法技術,並不斷吸收海量文本數據中詞彙、結構、語法、語義等方面的新知識,實現模型效果不斷進化。為用戶提供更加便捷的信息和服務以及更為智能化的體驗。" }, + "taichu_vqa": { + "description": "Taichu 2.0V 融合了圖像理解、知識遷移、邏輯歸因等能力,在圖文問答領域表現突出。" + }, "togethercomputer/StripedHyena-Nous-7B": { "description": "StripedHyena Nous (7B) 通過高效的策略和模型架構,提供增強的計算能力。" }, diff --git a/src/config/modelProviders/google.ts b/src/config/modelProviders/google.ts index babb9e83cacc..62550c12c617 100644 --- a/src/config/modelProviders/google.ts +++ b/src/config/modelProviders/google.ts @@ -22,7 +22,6 @@ const Google: ModelProviderCard = { { description: 'Gemini 1.5 Flash 0827 提供了优化后的多模态处理能力,适用多种复杂任务场景。', displayName: 'Gemini 1.5 Flash 0827', - enabled: true, functionCall: true, id: 'gemini-1.5-flash-exp-0827', maxOutput: 8192, @@ -45,12 +44,49 @@ const Google: ModelProviderCard = { tokens: 1_048_576 + 8192, vision: true, }, + { + description: + 'Gemini 1.5 Flash 8B 0924 是最新的实验性模型,在文本和多模态用例中都有显著的性能提升。', + displayName: 'Gemini 1.5 Flash 8B 0924', + enabled: true, + functionCall: true, + id: 'gemini-1.5-flash-8b-exp-0924', + maxOutput: 8192, + pricing: { + cachedInput: 0.018_75, + input: 0.075, + output: 0.3, + }, + releasedAt: '2024-09-24', + tokens: 1_048_576 + 8192, + vision: true, + }, { description: 'Gemini 1.5 Flash 001 是一款高效的多模态模型,支持广泛应用的扩展。', displayName: 'Gemini 1.5 Flash 001', functionCall: true, id: 'gemini-1.5-flash-001', maxOutput: 8192, + pricing: { + cachedInput: 0.018_75, + input: 0.075, + output: 0.3, + }, + tokens: 1_048_576 + 8192, + vision: true, + }, + { + description: 'Gemini 1.5 Flash 002 是一款高效的多模态模型,支持广泛应用的扩展。', + displayName: 'Gemini 1.5 Flash 002', + functionCall: true, + id: 'gemini-1.5-flash-002', + maxOutput: 8192, + pricing: { + cachedInput: 0.018_75, + input: 0.075, + output: 0.3, + }, + releasedAt: '2024-09-25', tokens: 1_048_576 + 8192, vision: true, }, @@ -74,7 +110,6 @@ const Google: ModelProviderCard = { { description: 'Gemini 1.5 Pro 0827 结合最新优化技术,带来更高效的多模态数据处理能力。', displayName: 'Gemini 1.5 Pro 0827', - enabled: true, functionCall: true, id: 'gemini-1.5-pro-exp-0827', maxOutput: 8192, @@ -117,6 +152,23 @@ const Google: ModelProviderCard = { tokens: 2_097_152 + 8192, vision: true, }, + { + description: + 'Gemini 1.5 Pro 002 是最新的生产就绪模型,提供更高质量的输出,特别在数学、长上下文和视觉任务方面有显著提升。', + displayName: 'Gemini 1.5 Pro 002', + enabled: true, + functionCall: true, + id: 'gemini-1.5-pro-002', + maxOutput: 8192, + pricing: { + cachedInput: 0.315, + input: 1.25, + output: 2.5, + }, + releasedAt: '2024-09-24', + tokens: 2_097_152 + 8192, + vision: true, + }, { description: 'Gemini 1.0 Pro 是Google的高性能AI模型,专为广泛任务扩展而设计。', displayName: 'Gemini 1.0 Pro', diff --git a/src/libs/agent-runtime/google/index.test.ts b/src/libs/agent-runtime/google/index.test.ts index 8b54fb8aabbe..469286a41eb6 100644 --- a/src/libs/agent-runtime/google/index.test.ts +++ b/src/libs/agent-runtime/google/index.test.ts @@ -304,6 +304,30 @@ describe('LobeGoogleAI', () => { describe('private method', () => { describe('convertContentToGooglePart', () => { + it('should handle text type messages', async () => { + const result = await instance['convertContentToGooglePart']({ + type: 'text', + text: 'Hello', + }); + expect(result).toEqual({ text: 'Hello' }); + }); + + it('should handle base64 type images', async () => { + const base64Image = + 'data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg=='; + const result = await instance['convertContentToGooglePart']({ + type: 'image_url', + image_url: { url: base64Image }, + }); + + expect(result).toEqual({ + inlineData: { + data: 'iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg==', + mimeType: 'image/png', + }, + }); + }); + it('should handle URL type images', async () => { const imageUrl = 'http://example.com/image.png'; const mockBase64 = 'mockBase64Data'; @@ -357,7 +381,7 @@ describe('LobeGoogleAI', () => { { content: 'Hi', role: 'assistant' }, ]; - const contents = await instance['buildGoogleMessages'](messages, 'gemini-pro'); + const contents = await instance['buildGoogleMessages'](messages, 'gemini-1.0'); expect(contents).toHaveLength(3); expect(contents).toEqual([ @@ -373,7 +397,7 @@ describe('LobeGoogleAI', () => { { content: 'Who are you', role: 'user' }, ]; - const contents = await instance['buildGoogleMessages'](messages, 'gemini-pro'); + const contents = await instance['buildGoogleMessages'](messages, 'gemini-1.0'); expect(contents).toHaveLength(3); expect(contents).toEqual([ @@ -487,9 +511,6 @@ describe('LobeGoogleAI', () => { }); }); - // 类似地添加 array/string/number/boolean 类型schema的测试用例 - // ... - it('should correctly convert nested schema', () => { const schema: JSONSchema7 = { type: 'object', @@ -523,6 +544,36 @@ describe('LobeGoogleAI', () => { }, }); }); + + it('should correctly convert array schema', () => { + const schema: JSONSchema7 = { + type: 'array', + items: { type: 'string' }, + }; + const converted = instance['convertSchemaObject'](schema); + expect(converted).toEqual({ + type: FunctionDeclarationSchemaType.ARRAY, + items: { type: FunctionDeclarationSchemaType.STRING }, + }); + }); + + it('should correctly convert string schema', () => { + const schema: JSONSchema7 = { type: 'string' }; + const converted = instance['convertSchemaObject'](schema); + expect(converted).toEqual({ type: FunctionDeclarationSchemaType.STRING }); + }); + + it('should correctly convert number schema', () => { + const schema: JSONSchema7 = { type: 'number' }; + const converted = instance['convertSchemaObject'](schema); + expect(converted).toEqual({ type: FunctionDeclarationSchemaType.NUMBER }); + }); + + it('should correctly convert boolean schema', () => { + const schema: JSONSchema7 = { type: 'boolean' }; + const converted = instance['convertSchemaObject'](schema); + expect(converted).toEqual({ type: FunctionDeclarationSchemaType.BOOLEAN }); + }); }); describe('convertOAIMessagesToGoogleMessage', () => { @@ -592,6 +643,49 @@ describe('LobeGoogleAI', () => { ], }); }); + + it('should correctly convert function call message', async () => { + const message = { + role: 'assistant', + tool_calls: [ + { + id: 'call_1', + function: { + name: 'get_current_weather', + arguments: JSON.stringify({ location: 'London', unit: 'celsius' }), + }, + type: 'function', + }, + ], + } as OpenAIChatMessage; + + const converted = await instance['convertOAIMessagesToGoogleMessage'](message); + expect(converted).toEqual({ + role: 'function', + parts: [ + { + functionCall: { + name: 'get_current_weather', + args: { location: 'London', unit: 'celsius' }, + }, + }, + ], + }); + }); + + it('should correctly handle empty content', async () => { + const message: OpenAIChatMessage = { + role: 'user', + content: '' as any, // explicitly set as empty string + }; + + const converted = await instance['convertOAIMessagesToGoogleMessage'](message); + + expect(converted).toEqual({ + role: 'user', + parts: [{ text: '' }], + }); + }); }); }); }); diff --git a/src/libs/agent-runtime/google/index.ts b/src/libs/agent-runtime/google/index.ts index 1c6130aa3199..ecc80c9d2855 100644 --- a/src/libs/agent-runtime/google/index.ts +++ b/src/libs/agent-runtime/google/index.ts @@ -1,5 +1,6 @@ import { Content, + FunctionCallPart, FunctionDeclaration, FunctionDeclarationSchemaProperty, FunctionDeclarationSchemaType, @@ -11,6 +12,7 @@ import { JSONSchema7 } from 'json-schema'; import { transform } from 'lodash-es'; import { imageUrlToBase64 } from '@/utils/imageToBase64'; +import { safeParseJSON } from '@/utils/safeParseJSON'; import { LobeRuntimeAI } from '../BaseAI'; import { AgentRuntimeErrorType, ILobeAgentRuntimeErrorType } from '../error'; @@ -50,8 +52,9 @@ export class LobeGoogleAI implements LobeRuntimeAI { this.baseURL = baseURL; } - async chat(payload: ChatStreamPayload, options?: ChatCompetitionOptions) { + async chat(rawPayload: ChatStreamPayload, options?: ChatCompetitionOptions) { try { + const payload = this.buildPayload(rawPayload); const model = payload.model; const contents = await this.buildGoogleMessages(payload.messages, model); @@ -88,7 +91,11 @@ export class LobeGoogleAI implements LobeRuntimeAI { }, { apiVersion: 'v1beta', baseUrl: this.baseURL }, ) - .generateContentStream({ contents, tools: this.buildGoogleTools(payload.tools) }); + .generateContentStream({ + contents, + systemInstruction: payload.system as string, + tools: this.buildGoogleTools(payload.tools), + }); const googleStream = googleGenAIResultToStream(geminiStreamResult); const [prod, useForDebug] = googleStream.tee(); @@ -111,6 +118,16 @@ export class LobeGoogleAI implements LobeRuntimeAI { } } + private buildPayload(payload: ChatStreamPayload) { + const system_message = payload.messages.find((m) => m.role === 'system'); + const user_messages = payload.messages.filter((m) => m.role !== 'system'); + + return { + ...payload, + messages: user_messages, + system: system_message?.content, + }; + } private convertContentToGooglePart = async (content: UserMessageContentPart): Promise => { switch (content.type) { case 'text': { @@ -152,6 +169,17 @@ export class LobeGoogleAI implements LobeRuntimeAI { message: OpenAIChatMessage, ): Promise => { const content = message.content as string | UserMessageContentPart[]; + if (!!message.tool_calls) { + return { + parts: message.tool_calls.map((tool) => ({ + functionCall: { + args: safeParseJSON(tool.function.arguments)!, + name: tool.function.name, + }, + })), + role: 'function', + }; + } return { parts: @@ -168,44 +196,44 @@ export class LobeGoogleAI implements LobeRuntimeAI { messages: OpenAIChatMessage[], model: string, ): Promise => { - // if the model is gemini-1.5-pro-latest, we don't need any special handling - if (model === 'gemini-1.5-pro-latest') { - const pools = messages - .filter((message) => message.role !== 'function') - .map(async (msg) => await this.convertOAIMessagesToGoogleMessage(msg)); + // if the model is gemini-1.0 we don't need to pair messages + if (model.startsWith('gemini-1.0')) { + const contents: Content[] = []; + let lastRole = 'model'; + + for (const message of messages) { + // current to filter function message + if (message.role === 'function') { + continue; + } + const googleMessage = await this.convertOAIMessagesToGoogleMessage(message); - return Promise.all(pools); - } + // if the last message is a model message and the current message is a model message + // then we need to add a user message to separate them + if (lastRole === googleMessage.role) { + contents.push({ parts: [{ text: '' }], role: lastRole === 'user' ? 'model' : 'user' }); + } - const contents: Content[] = []; - let lastRole = 'model'; + // add the current message to the contents + contents.push(googleMessage); - for (const message of messages) { - // current to filter function message - if (message.role === 'function') { - continue; + // update the last role + lastRole = googleMessage.role; } - const googleMessage = await this.convertOAIMessagesToGoogleMessage(message); - // if the last message is a model message and the current message is a model message - // then we need to add a user message to separate them - if (lastRole === googleMessage.role) { - contents.push({ parts: [{ text: '' }], role: lastRole === 'user' ? 'model' : 'user' }); + // if the last message is a user message, then we need to add a model message to separate them + if (lastRole === 'model') { + contents.push({ parts: [{ text: '' }], role: 'user' }); } - // add the current message to the contents - contents.push(googleMessage); - - // update the last role - lastRole = googleMessage.role; + return contents; } - // if the last message is a user message, then we need to add a model message to separate them - if (lastRole === 'model') { - contents.push({ parts: [{ text: '' }], role: 'user' }); - } + const pools = messages + .filter((message) => message.role !== 'function') + .map(async (msg) => await this.convertOAIMessagesToGoogleMessage(msg)); - return contents; + return Promise.all(pools); }; private parseErrorMessage(message: string): {