Việc hợp tác xây dựng bộ dữ liệu Tiếng Việt của hai tập đoàn nhằm cung cấp cho cộng đồng nghiên cứu một nguồn tài nguyên để phát triển các mô hình AI phù hợp với văn hóa và ngữ cảnh sử dụng Tiếng Việt.
Đại diện của Viettel Solutions, đơn vị trực tiếp tham gia vào thực hiện dự án cho biết, bộ dữ liệu này hiện đã được công bố trên trang chia sẻ công nghệ của Nvidia và sẵn sàng cung cấp miễn phí cho cộng đồng nghiên cứu phát triển AI tại Việt Nam.
Về điểm khác biệt của bộ dữ liệu tiếng Việt này, nhóm kỹ sư tham gia vào nghiên cứu của Viettel Solutions tiết lộ, bộ dữ liệu Tiếng Việt do Viettel và Nvidia hợp tác nghiên cứu đã được xử lý và lọc qua NeMo Curator, giúp giảm kích thước bộ dữ liệu mà không làm giảm chất lượng. Đây cũng là bộ dữ liệu Việt Nam chất lượng cao đầu tiên được công bố tới cộng đồng nghiên cứu và phát triển trí tuệ nhân tạo Việt Nam.
Nguồn: VTVMoney
Nội dung liên quan
- "Chốt deal" Nvidia Việt Nam: Hé mở hậu trường đầu tư của Nvidia tại Việt Nam
- CEO Nvidia tiết lộ lý do mua VinBrain
- Báo chí khu vực phát ghen với "thâm tình" Việt Nam - Nvidia
- Các gã khổng lồ Nvidia, Apple, Tesla đang chi bao nhiêu để bảo vệ CEO?
- Nvidia: Quân cờ mới trong cuộc chiến công nghệ Mỹ -Trung