OpenAI sẽ ra mắt mô hình ngôn ngữ 'trọng lượng mở' đầu tiên kể từ GPT-2 năm 2019
Mô hình ngôn ngữ sắp tới của OpenAI sẽ có thể truy cập công khai để sử dụng, chỉnh sửa và triển khai, đánh dấu sự thay đổi từ các hệ thống đóng gần đây của họ.
OpenAI đang chuẩn bị phát hành phiên bản 'trọng lượng mở' của mô hình ngôn ngữ của mình vào cuối năm nay, cho phép các nhà phát triển vận hành mô hình trên phần cứng của riêng họ.
Trong một cập nhật gần đây, CEO của OpenAI, Sam Altman, đã thông báo rằng công ty dự định ra mắt một mô hình ngôn ngữ mới với khả năng lý luận được nâng cao trong những tháng tới. Altman nhấn mạnh tầm quan trọng của việc thu thập phản hồi để đảm bảo tính hữu ích tối đa của mô hình.
Altman phát biểu, 'Chúng tôi đã cân nhắc điều này từ lâu, nhưng các ưu tiên khác đã chiếm ưu thế. Bây giờ, cảm thấy rất quan trọng để tiến hành.' Ông lưu ý rằng đây sẽ là mô hình 'trọng lượng mở' đầu tiên kể từ khi phát hành GPT-2 vào năm 2019.
Ông còn thêm, 'Chúng tôi vẫn còn một số quyết định phải đưa ra, vì vậy chúng tôi đang tổ chức các sự kiện dành cho nhà phát triển để thu thập phản hồi và cho phép tương tác sớm với các nguyên mẫu.'
Nguồn: Sam Altman
Một mô hình ngôn ngữ 'trọng lượng mở' có sẵn để sử dụng công khai, cho phép cá nhân tải xuống, chỉnh sửa hoặc triển khai cho mục đích riêng của họ. Mặc dù không mở như một mô hình mã nguồn mở, nhưng nó đại diện cho một sự khác biệt đáng kể so với các mô hình đóng như GPT-3 và GPT-4.
Các sự kiện dành cho nhà phát triển cho mô hình mới dự kiến sẽ bắt đầu tại San Francisco, California, nơi OpenAI đặt trụ sở, trong những tuần tới, với các phiên tiếp theo được lên kế hoạch cho châu Âu và khu vực châu Á-Thái Bình Dương.
Nguồn: Steven Heidel
Altman bày tỏ sự hào hứng về các ứng dụng tiềm năng, nói rằng, 'Chúng tôi rất hào hứng để xem những gì các nhà phát triển sẽ tạo ra và cách các công ty lớn và chính phủ sẽ sử dụng nó khi họ thích tự vận hành một mô hình.'
Ông cũng đề cập, 'Chúng tôi sẽ nỗ lực thêm vào việc biết rằng mô hình này sẽ được chỉnh sửa sau khi phát hành.'
Mô hình 'Trọng lượng mở' đầu tiên của OpenAI kể từ GPT-2 năm 2019
Mô hình 'trọng lượng mở' trước đây của OpenAI, GPT-2, đã được phát hành một phần vào tháng 2 năm 2019, với một phát hành đầy đủ theo sau vào tháng 11 cùng năm.
Altman cũng đã chỉ ra rằng OpenAI nhắm đến việc phát hành GPT-4.5 và GPT-5 trong những tuần hoặc tháng tới.
Cuộc cạnh tranh trong lĩnh vực AI đang gia tăng, với việc ra mắt DeepSeek, một đối thủ của ChatGPT, được báo cáo là đã phát triển với chi phí thấp hơn và trong thời gian ngắn hơn.
Nhóm Alibaba đã giới thiệu mô hình AI mã nguồn mở mới của mình cho các đại lý AI tiết kiệm chi phí vào ngày 26 tháng 3, trong khi Google công bố Gemini 2.5, mô hình AI thử nghiệm mới nhất của mình, vào ngày 25 tháng 3.
Trong khi đó, CEO của Meta, Mark Zuckerberg, thông báo rằng gia đình mô hình AI của công ty, Llama, được phát hành vào tháng 2 năm 2023, đã đạt 1 tỷ lượt tải xuống.
Theo Cointelegraph