Được tổ chức từ năm 2017, Zalo AI Summit là sự kiện quy tụ các chuyên gia uy tín trong lĩnh vực trí tuệ nhân tạo (AI) tại Việt Nam và trên thế giới. Tại hội thảo, chuyên gia sẽ thảo luận về các giải pháp nhằm ứng dụng AI vào nhiều khía cạnh trong cuộc sống.
Zalo AI Summit 2022 diễn ra sáng 17/12 với chủ đề “AI đã thay đổi cuộc sống người Việt như thế nào”. Ngoài thành tựu nổi bật, một số thách thức trong vận hành hệ thống AI, bên cạnh giải pháp tối ưu cũng được các chuyên gia thảo luận.
Khó khăn từ những điều nhỏ nhất
Tại Zalo, các sản phẩm tích hợp AI nổi bật gồm trợ lý giọng nói Kiki và hệ thống định danh điện tử eKYC. Từ khi ra mắt vào tháng 12/2020, Kiki đã ghi nhận hơn 200.000 lượt tải và sử dụng trên xe hơi, phục vụ 125.000 lượt truy vấn mỗi ngày.
Ông Nguyễn Hoàng Khánh Duy, Quản lý Sản phẩm Kiki cho biết từ khi chuyển đổi trợ lý từ Zing MP3 sang mô hình sử dụng trên xe hơi, đội ngũ phát triển gặp khó khăn trong việc nhận diện tên địa điểm từ giọng nói. Lý do đến từ kho dữ liệu ban đầu của Kiki chỉ bao gồm lời bài hát.
Đại diện Kiki đưa ra trường hợp sử dụng thực tế, khi nhiều thông tin nhập vào từ người dùng bao gồm cả tiếng Việt và nhiều ngôn ngữ khác. Do đó, Kiki cần đủ thông minh để nhận biết nội dung.
Nhằm khắc phục vấn đề trên, đội ngũ phát triển Kiki đã bổ sung 350.000 địa điểm vào mô hình chuyển giọng nói thành văn bản (ASR). Nhờ đó, trợ lý này có thể "hiểu" địa điểm từ câu lệnh tốt hơn và phân biệt với lời bài hát.
Một thách thức khác nằm ở câu lệnh có quãng nghỉ dài (do thói quen người dùng), trợ lý giọng nói có thể dừng nhận lệnh dù chưa hết câu. Đội ngũ Kiki đã tích hợp module nhận diện giọng nói (Voice Activity Detection - VAD), kết hợp phân tích bối cảnh để nhận biết thời điểm hoàn thành câu lệnh khi người dùng dừng nói.
Theo ông Duy, giải pháp này giúp giảm 40% lần dừng sai, và giảm 30% thời gian chờ dừng lệnh. Đại diện Kiki cho biết sẽ liên tục cập nhật để mang đến sản phẩm tốt hơn.
"Xây dựng Kiki là hành trình cố gắng, chăm chút từ những điều nhỏ nhất để tạo ra sự khác biệt, mang đến trải nghiệm tốt nhất cho người dùng", ông Duy chia sẻ.
Khó tạo ra AI hoàn hảo ngay từ đầu
Được ra mắt từ năm 2020, eKYC là giải pháp định danh điện tử bằng AI, sử dụng ảnh chân dung đối chiếu với căn cước công dân để xác minh danh tính người dùng.
Ông Châu Thành Đức, Giám đốc Khoa học Dữ liệu Zalo AI cho biết tương tự các dự án ứng dụng AI khác, eKYC gặp nhiều thách thức khi sử dụng trong môi trường thực tế.
Các vấn đề được ông Đức mô tả gồm ảnh căn cước bị mờ, chói sáng tại vùng dán ảnh thẻ hoặc căn cước giả. Lỗi từ ảnh chân dung cũng có thể khiến quá trình xác thực không thành công.
"Một mô hình eKYC muốn đi vào sử dụng thực tế phải giải quyết được những vấn đề này", ông Đức nói.
Đại diện Zalo AI Lab liệt kê một số trường hợp tác động đến quá trình xác thực như cố tình tấn công cho mục đích xấu (dùng căn cước giả, ảnh chân dung in hoặc hình nộm…), người dùng bị tai nạn biến dạng mặt hoặc phẫu thuật thẩm mỹ.
Từ các trường hợp trên, Zalo AI Lab đã xây dựng các giải pháp giúp eKYC nhận diện đúng, giảm tỷ lệ lỗi nhưng vẫn xử lý với tốc độ cao.
Dù vậy, một số mô hình phải đánh đổi thời gian lấy sự chính xác hoặc ngược lại. Vài trường hợp khó thậm chí vẫn cần dùng biện pháp xác thực thủ công.
Tối ưu để sử dụng trong thực tế là mục tiêu chính của eKYC. Dù vậy theo ông Đức, vẫn còn "chặng đường dài" để tạo ra sản phẩm tốt hơn theo từng ngày.
"Sự hoàn hảo trên AI có thể không có thật trong thực tế. Đội ngũ muốn gửi gắm mục tiêu phát hiện ra lỗi và hoàn thiện sản phẩm mỗi ngày", ông Đức nói thêm.
Cách để AI dạy tiếng Việt hiệu quả
PGS.TS Đinh Điền, Giám đốc Trung tâm Ngôn ngữ học Tính toán, Trường ĐH Khoa học Tự nhiên (ĐHQG TP.HCM) chia sẻ những yếu tố quan trọng khi ứng dụng AI vào ngôn ngữ học và giáo dục. Trong đó, việc sử dụng AI để dạy tiếng Việt được quan tâm.
Để xây dựng AI dạy tiếng Việt, các kỹ sư cần lập danh sách từ được sử dụng nhiều, sau đó "huấn luyện" AI cách tiếp nhận đầy đủ một từ hoặc cụm từ hoàn chỉnh, không bị ngắt quãng. Ngoài ra, AI cũng cần phân biệt loại từ (danh từ, động từ, tính từ...) để sử dụng đúng ngữ cảnh.
"Làm sao để AI biết đâu là một từ, đâu là tiếng, thành tố trong một từ. Các yêu cầu này buộc dùng đến máy học, AI", ông Đinh Điền chia sẻ quan điểm.
Sau khi nhận diện ngữ pháp, AI tiếp tục được huấn luyện để dạy văn phạm, gồm các câu dài và phức tạp theo từng cấp độ. Để nhận diện độ khó của câu, AI cần xác định tần suất sử dụng của các từ, cấu trúc câu (câu đơn, câu phức) và sự liên kết ý nghĩa giữa các câu.
Đặc điểm của tiếng Việt là một từ có thể mang nhiều nghĩa. Các kỹ sư có thể xây dựng kho dữ liệu gồm các câu chứa những từ trên, sau đó "huấn luyện" AI đưa ra gợi ý từ ngữ phù hợp, giúp người nước ngoài sử dụng đúng cách tùy ngữ cảnh.
Tiếp theo, ông Đinh Điền đặt vấn đề về các ứng dụng dịch thuật. Ông cho rằng kho dữ liệu của máy dịch ngày càng được mở rộng nhờ sự đóng góp của cộng đồng.
Tuy nhiên, tính ổn định của công nghệ vẫn cần được chứng minh dựa trên ngữ cảnh. Do đó, con người cần vận dụng kiến thức, kỹ năng cho các lĩnh vực yêu cầu cao hơn. Trong khi đó, AI có thể được sử dụng thay thế những nhu cầu cơ bản.
AI dịch thuật do người Việt xây dựng có thể ứng dụng trong doanh nghiệp, hỗ trợ công ty nước ngoài. Ông Điền khẳng định đó là thế mạnh của người Việt trong xây dựng dữ liệu ngôn ngữ để huấn luyện AI trong dịch thuật.
Thách thức khi ứng dụng AI trong y tế
Nói về ứng dụng AI trong sinh học và y tế, TS Sơn Phạm, CEO BioTuring cho rằng con người đang tìm cách khai phá vũ trụ. Tuy nhiên, một vũ trụ khác bên cạnh chúng ta có thể được nghiên cứu, chính là sinh học.
"Khi dùng kính hiển vi soi vào đầu ngón tay, chúng ta nhìn thấy một tế bào. Sâu trong đó là các lớp tế bào, nhân tế bào. Trong nhân là bộ gen, là nhiễm sắc thể", ông Sơn chia sẻ.
Theo CEO BioTuring, một trong những khía cạnh nghiên cứu AI phổ biến tập trung vào phân tích tế bào miễn dịch và ung thư. Thách thức là nhận biết tế bào nguy hiểm, đồng thời "dịch" dữ liệu đại diện các cấu trúc xoắn của chuỗi protein.
TS Sơn Phạm cho biết AI có thể được ứng dụng để nhận biết từng tế bào, sau đó phân loại, phân tích cách tương tác cũng như nhận biết tế bào có khả năng gây bệnh. Với ứng dụng trên, AI sẽ giúp tìm ra các loại tế bào mới, lập bản đồ tế bào trong mỗi con người, từ đó so sánh sự khác biệt giữa người khỏe mạnh và người bệnh.