Mô hình AI mã nguồn mở mới của Nvidia vượt trội hơn GPT-4o trong các bảng xếp hạng
Mô hình mới phát hành, phiên bản được điều chỉnh từ Llama-70b của Meta, thể hiện hiệu suất vượt trội.
Nvidia đã lặng lẽ giới thiệu một mô hình trí tuệ nhân tạo đột phá vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hàng đầu như GPT-4o và Claude-3.
Theo một bài đăng từ tài khoản Nvidia AI Developer, mô hình có tên Llama-3.1-Nemotron-70B-Instruct được mô tả là một 'mô hình dẫn đầu' trên Chatbot Arena của lmarena.AI.
Nguồn: Nvidia AI
Nemotron
Llama-3.1-Nemotron-70B-Instruct về cơ bản là phiên bản được điều chỉnh của Llama-3.1-70B-Instruct mã nguồn mở của Meta. Thành phần 'Nemotron' phản ánh sự nâng cấp của Nvidia đối với mô hình.
Chuỗi mô hình AI Llama, được Meta gọi là 'đàn', được thiết kế như nền tảng mã nguồn mở cho các nhà phát triển xây dựng.
Với Nemotron, Nvidia đã đảm nhận nhiệm vụ nâng cao mô hình để trở nên 'hữu ích' hơn so với các đối thủ phổ biến như ChatGPT của OpenAI và Claude-3 của Anthropic.
Nvidia đã sử dụng các tập dữ liệu được chọn lọc đặc biệt, kỹ thuật điều chỉnh tiên tiến và phần cứng AI tiên tiến của mình để biến mô hình cơ bản của Meta thành hệ thống AI có thể 'hữu ích' nhất trên thế giới.
Bài đăng của một kỹ sư trên X.com bày tỏ sự phấn khích về khả năng của Nemotron. Nguồn: Shayan Taslim
Đánh giá hiệu suất
Xác định mô hình AI 'tốt nhất' không có phương pháp trực tiếp, khác với việc đo nhiệt độ bằng nhiệt kế. Hiệu suất của mô hình AI là chủ quan và được đánh giá thông qua các bài kiểm tra so sánh.
Đánh giá hiệu suất AI bao gồm việc đưa ra cùng một thử thách cho các mô hình khác nhau và so sánh tính hữu dụng của các phản hồi của chúng, thường được đánh giá bởi các giám khảo con người để đảm bảo tính khách quan.
Nvidia tuyên bố rằng Nemotron vượt trội hơn các mô hình hàng đầu như GPT-4o và Claude-3 với một khoảng cách đáng kể.
Đỉnh bảng xếp hạng của Chatbot Arena. Nguồn: LLMArena
Hình ảnh cho thấy các điểm số trên bài kiểm tra 'Khó' của bảng xếp hạng Chatbot Arena. Mặc dù Llama-3.1-Nemotron-70B-Instruct của Nvidia không được liệt kê, Nvidia tuyên bố rằng nó đã đạt điểm số 85, đặt nó vào vị trí người dẫn đầu trong hạng mục này.
Điều đặc biệt đáng chú ý là Llama-3.1-70B được coi là mô hình mã nguồn mở cấp trung của Meta. Có một phiên bản lớn hơn, Llama-3.1-405B, sử dụng 405 tỷ tham số để điều chỉnh.
So sánh, GPT-4o được ước tính đã được phát triển với hơn 1 nghìn tỷ tham số.
Theo Cointelegraph