რატომ იწვევს Weibo-ს პატარა VibeThinker-3B-ი კამათს ხელოვნური ინტელექტის სამყაროში

კვირა დღეს, Sina Weibo-ს — ჩინური სოციალური მედიის გიგანტის, რომელიც უფრო მეტად ცნობილია მისი მიკრობლოგინგის პლატფორმით, ვიდრე სიღრმისეული ხელოვნური ინტელექტით — ცხრა მკვლევარისგან შემდგარმა გუნდმა arXiv-ზე გამოაქვეყნა 14-გვერდიანი ტექნიკური ანგარიში, რომელმაც შოკი გამოიწვია ხელოვნური ინტელექტის კვლევით საზოგადოებაში. მათი მტკიცება შემდეგია: სულ 3 მილიარდი პარამეტრის მქონე ენობრივ მოდელს შეუძლია გაუტოლდეს ან გადააჭარბოს Google DeepMind-ის, OpenAI-ის, Anthropic-ისა და DeepSeek-ის წამყვანი სისტემების მსჯელობის შესაძლებლობებს, რომლებიც ასობით ჯერ უფრო დიდია.

VibeThinker-3B სახელწოდების მოდელმა AIME 2026-ზე — ამერიკის მოწვეული მათემატიკის გამოცდაზე — 94.3 ქულა დააგროვა, რაც განსაკუთრებით შთამბეჭდავი შედეგია ასეთი მცირე ზომის მოდელისთვის. ეს მიღწევა სპეციალისტებს შორის ცხარე დისკუსიას იწვევს: ნამდვილად შეიძლება თუ არა პატარა, ეფექტური მოდელი ასე მნიშვნელოვნად გადააჭარბოს გაცილებით დიდ სისტემებს, თუ საქმე ბენჩმარქების მანიპულაციას ეხება.

ეს სიახლე კიდევ ერთხელ ანთებს კამათს ხელოვნური ინტელექტის შეფასების სტანდარტებზე. მრავალი ექსპერტი მიუთითებს, რომ ბენჩმარქები შეიძლება მოდელის რეალური შესაძლებლობების ამსახველი არ იყოს, განსაკუთრებით მაშინ, როდესაც მცირე კომპანიები წარმოუდგენელ შედეგებს აცხადებენ. Weibo-ს გამოქვეყნება კი კიდევ ერთხელ ახსენებს ინდუსტრიას, რომ ხელოვნური ინტელექტის კვლევაში გამჭვირვალობა და შეფასების სანდო მეთოდები უმნიშვნელოვანეს საკითხად რჩება.

Photo: Timothy Dykes / Unsplash

უფასო სერვისების მიღება ქალებს დისტანციურ რეჟიმშიც შეუძლიათ

გაუმჭვირვალე თვითმმართველობები და მოქალაქეთა ჩართულობის პრობლემები – NEO TV – მ პროექტის შედეგები შეაჯამა

რეპრესიები “სამართლის” სახელით – პატიმრობაში კიდევ 8 აქტივისტი გაუშვეს

მედია რეპრესიების პირობებში – დემოკრატიის გზა და ისტორიული პარალელები

რატომ იწვევს Weibo-ს პატარა VibeThinker-3B-ი კამათს ხელოვნური ინტელექტის სამყაროში

ციფრული ხიდები სამშვიდობო პროცესებში – რა როლს ითამაშებს AI კონფლიქტების მოგვარებაში?

პოლიციამ Evil Corp-თან დაკავშირებული SocGholish ბოტნეტი დაშალა

პოლიციამ Evil Corp-თან დაკავშირებული SocGholish ბოტნეტი გაანადგურა

რაკეტის რეპორტი: Blue Origin-ის სამშვიდობო მოედანი განახლდება; Relativity-ი მარსს მიზნად ისახავს

ინდოეთში Telegram-ის აკრძალვამ VPN-ებსა და კონკურენტ აპლიკაციებზე მოთხოვნა გაზარდა

დაკავშირებული სტატიები

რა როლი აქვთ მშობლებს შვილის წარმატებაში და რატომ გახდა ხელოვნური ინტელექტი მომავლის გასაღები?

ციფრული ხიდები სამშვიდობო პროცესებში – რა როლს ითამაშებს AI კონფლიქტების მოგვარებაში?

პოლიციამ Evil Corp-თან დაკავშირებული SocGholish ბოტნეტი დაშალა

პოლიციამ Evil Corp-თან დაკავშირებული SocGholish ბოტნეტი გაანადგურა

თეგები

რატომ იწვევს Weibo-ს პატარა VibeThinker-3B-ი კამათს ხელოვნური ინტელექტის სამყაროში

Share this:

დაკავშირებული სტატიები

თეგები