3B модель меньше параметров выше результаты
⚡ 3B модель меньше параметров выше результаты
Nanbeige4-3B-25-11 — модель с 3 млрд параметров (в 100 раз меньше GPT-4!), но на тестах обходит модели в 10 раз крупнее. 🤖 На бенчмарке WritingBench её результаты сравнялись с Gemini-2.5-Pro и Deepseek-R1 — уровнями проприетарных систем. Парадокс: качество данных важнее размера. Маленькая, но мощная — идеальный пример, что не всегда «больше = лучше». Впечатляет! 🚀
🧐 Экспертное мнение:
Классический пример, как умные данные заменяют умные чипы — но это уже не революция, а просто маркетинговая уловка, чтобы продать идею, что «маленькая модель» — это прорыв, хотя все знают, что качество данных важнее масштаба.
#IT #News #Tech