[Recap] Webinar ứng dụng LLM nguồn mở tiếng việt vào các bài toán thực tế
Tối 17/4 vừa qua, Mindmaid đã tổ chức thành công webinar "Ứng dụng LLM nguồn mở tiếng Việt vào các bài toán thực tế" với khách mời là Mr Quân Nguyễn - cựu kĩ sư của OpenAI và đồng tác giả của nhiều mô hình nguồn mở như VinaLlama, Vistral...
Phát triển sản phẩm từ LLM nguồn mở, đặc biệt LLM nguồn mở tiếng Việt đang là mối quan tâm chung của nhiều AI Developer hiện nay. Nắm bắt nhu cầu đó, tối 17/4 vừa qua, Mindmaid đã tổ chức thành công webinar "Ứng dụng LLM nguồn mở tiếng Việt vào các bài toán thực tế" với khách mời là Mr Quân Nguyễn - cựu kĩ sư của OpenAI và đồng tác giả của nhiều mô hình nguồn mở như VinaLlama, Vistral...
LLM nguồn mở đang phát triển rất mạnh
Mở đầu buổi webinar là phần trình bày tổng quan về LLM nguồn mở nói chung và LLM nguồn mở tiếng Việt nói riêng của Mr Quân Nguyễn. Theo Mr Quân, phong trào LLM nguồn mở đã phát triển rất nhanh chóng trong thời gian qua, đặc biệt kể từ khi Meta tung ra model Llama có chất lượng khá tốt, đã thúc đẩy phong trào finetune của các AI developer trên thế giới.
Việc phong trào LLM nguồn mở phát triển sôi động, đã tạo nên thế đứng cân bằng với phong trào LLM nguồn đóng của các công ty thương mại. Quân cũng nhấn mạnh sự cần thiết của việc phát triển các LLM tiếng Việt do đa số LLM nước ngoài thường không hỗ trợ tốt tiếng Việt, dẫn đến chất lượng sử dụng các LLM phổ biến trên tiếng Việt kém hơn hẳn tiếng Anh.
Một số LLM tiếng Việt phổ biến được Mr Quân nhắc tới là PhoGPT-7B, PhoGPT-4B, ViGPT-1.6B, VinaLlama-7B, 2.7B, VinaLlama-2, VinaLlama-2-Turbo, Vistral-7B. Quân cũng đánh giá cáo benchmark VMLU do ZaloAI phát triển, và cho rằng đây là bảng xếp hạng uy tín nhất đối với LLM tiếng Việt.
4 ứng dụng thực tế nhất của LLM nguồn mở
Trong phần tiếp theo của webinar, Mr Lộc Đặng - Founder của nền tảng phát triển Chatbot AI Mindmaid đã trình bày một số ứng dụng thực tế của LLM nguồn mở nói chung và LLM tiếng Việt nói riêng từ góc nhìn của một người ứng dụng.
Theo Mr Lộc, LLM nguồn mở hiện nay đại đa số mới có chất lượng tương đương gpt3.5, và khả năng xử lý tiếng Việt vẫn còn hạn chế. Do đó hiện phù hợp nhất là ứng dụng vào các bài toán Chatbot Chăm sóc khách hàng đơn giản. Các bài toán đòi hỏi sử dụng ngôn ngữ phức tạp hơn như viết văn, làm thơ, suy luận toán học...sẽ cần phải finetune thêm.
Ngoài ra Mr Lộc cũng trao đổi một hướng ứng dụng đáng chú ý hiện này là dùng LLM nguồn mở để fine-tune thêm trên các tập dữ liệu riêng như text-to-sql, dữ liệu code...để từ đó đạt chất lượng tương đương GPT-4 trên một số bài toán cụ thể. Một cách ứng dụng tương tự khác mà không cần phải fine-tune là dùng LLM nguồn mở để chạy kiến trúc AI Agent/Multi-Agent, cũng có thể đạt được chất lượng vượt GPT-4 trên bài toán mong muốn.
Phần cuối webinar, Mr Quân Nguyễn chia sẻ những kinh nghiệm cụ thể trong việc fine-tune LLM, và giải đáp nhiều câu hỏi thú vị đến từ những người tham gia về kĩ thuật fine-tune, bài toán tokenize tiếng Việt, kinh nghiệm học để trở thành AI Developer...
Dưới đây là link tải slide rút gọn của buổi webinar này