Mô hình AI mã nguồn mở mới của Nvidia vượt trội hơn GPT-4o trong các bảng xếp hạng

Mô hình mới phát hành, phiên bản được điều chỉnh từ Llama-70b của Meta, thể hiện hiệu suất vượt trội.

Nvidia đã lặng lẽ giới thiệu một mô hình trí tuệ nhân tạo đột phá vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hàng đầu như GPT-4o và Claude-3.

Theo một bài đăng từ tài khoản Nvidia AI Developer, mô hình có tên Llama-3.1-Nemotron-70B-Instruct được mô tả là một 'mô hình dẫn đầu' trên Chatbot Arena của lmarena.AI.

NVidia, Technology, Meta, ChatGPT, OpenAI — *Nguồn: Nvidia AI*

Nemotron

Llama-3.1-Nemotron-70B-Instruct về cơ bản là phiên bản được điều chỉnh của Llama-3.1-70B-Instruct mã nguồn mở của Meta. Thành phần 'Nemotron' phản ánh sự nâng cấp của Nvidia đối với mô hình.

Chuỗi mô hình AI Llama, được Meta gọi là 'đàn', được thiết kế như nền tảng mã nguồn mở cho các nhà phát triển xây dựng.

Với Nemotron, Nvidia đã đảm nhận nhiệm vụ nâng cao mô hình để trở nên 'hữu ích' hơn so với các đối thủ phổ biến như ChatGPT của OpenAI và Claude-3 của Anthropic.

Nvidia đã sử dụng các tập dữ liệu được chọn lọc đặc biệt, kỹ thuật điều chỉnh tiên tiến và phần cứng AI tiên tiến của mình để biến mô hình cơ bản của Meta thành hệ thống AI có thể 'hữu ích' nhất trên thế giới.

Đánh giá hiệu suất

Xác định mô hình AI 'tốt nhất' không có phương pháp trực tiếp, khác với việc đo nhiệt độ bằng nhiệt kế. Hiệu suất của mô hình AI là chủ quan và được đánh giá thông qua các bài kiểm tra so sánh.

Đánh giá hiệu suất AI bao gồm việc đưa ra cùng một thử thách cho các mô hình khác nhau và so sánh tính hữu dụng của các phản hồi của chúng, thường được đánh giá bởi các giám khảo con người để đảm bảo tính khách quan.

Nvidia tuyên bố rằng Nemotron vượt trội hơn các mô hình hàng đầu như GPT-4o và Claude-3 với một khoảng cách đáng kể.

Hình ảnh cho thấy các điểm số trên bài kiểm tra 'Khó' của bảng xếp hạng Chatbot Arena. Mặc dù Llama-3.1-Nemotron-70B-Instruct của Nvidia không được liệt kê, Nvidia tuyên bố rằng nó đã đạt điểm số 85, đặt nó vào vị trí người dẫn đầu trong hạng mục này.

Điều đặc biệt đáng chú ý là Llama-3.1-70B được coi là mô hình mã nguồn mở cấp trung của Meta. Có một phiên bản lớn hơn, Llama-3.1-405B, sử dụng 405 tỷ tham số để điều chỉnh.

So sánh, GPT-4o được ước tính đã được phát triển với hơn 1 nghìn tỷ tham số.

Theo Cointelegraph

Tin khác

Nishad Singh Yêu Cầu Thời Gian Đã Phục Vụ, Trích Dẫn Vai Trò 'Hạn Chế' Trong Sự Sụp Đổ Của FTX

18/10/2024

Quỹ ETF Bitcoin Giao Ngay Vượt Qua $20 Tỷ Nhờ Dòng Vốn Liên Tục

18/10/2024

Trang web của Ambient Finance bị hack: Người dùng được khuyến cáo đợi giải quyết

18/10/2024

FBI Bắt Giữ Hacker Đứng Sau Thông Báo Sai Lệch Về Bitcoin ETF Của SEC

18/10/2024

Thuế Crypto của Ấn Độ: Chiến lược của Chính phủ nhằm loại bỏ Công nghệ Blockchain

17/10/2024