Cuộc đua đưa công nghệ đằng sau ChatGPT vào điện thoại thông minh đang nóng dần. Những bước tiến mới nhất trong trí tuệ nhân tạo có thể biến đổi truyền thông di động và máy tính nhanh hơn nhiều so với những gì có thể xảy ra chỉ vài tháng trước.
Theo Finantial Times, khi các công ty công nghệ gấp rút nhúng AI vào phần mềm và dịch vụ của họ, họ phải đối mặt với chi phí điện toán cao hơn đáng kể. Mối lo ngại đặc biệt đè nặng lên Google, khi các nhà phân tích Phố Wall cảnh báo tỷ suất lợi nhuận của công ty có thể giảm sút nếu người dùng tìm kiếm trên internet mong đợi nội dung do AI tạo ra trong các kết quả tìm kiếm tiêu chuẩn.
Đưa công nghệ AI mới nhất vào thiết bị di động
Chạy AI tổng quát trên thiết bị cầm tay di động, thay vì thông qua đám mây trên các máy chủ do các tập đoàn công nghệ lớn vận hành, có thể là câu trả lời cho một trong những câu hỏi kinh tế lớn nhất do mốt công nghệ mới nhất đặt ra.
Tuần trước, Google cho biết họ đã chạy một phiên bản PaLM 2, mô hình ngôn ngữ lớn mới nhất của họ, trên một chiếc điện thoại Samsung Galaxy. Mặc dù không trình diễn công khai mô hình thu nhỏ, được gọi là Gecko, nhưng động thái này là dấu hiệu mới nhất cho thấy một dạng AI yêu cầu tài nguyên máy tính chỉ có trong trung tâm dữ liệu đang nhanh chóng bắt đầu tìm đường đến nhiều nơi khác.
Cristiano Amon, giám đốc điều hành của công ty chip di động Qualcomm, cho biết các công ty cần tạo ra AI kết hợp, chạy trong cả trung tâm dữ liệu và cục bộ - nếu không sẽ tốn quá nhiều tiền.
Khi ChatGPT ra mắt vào cuối năm ngoái đã thu hút sự chú ý rộng rãi đến AI, triển vọng đưa AI mới lên thiết bị cầm tay dường như còn xa vời. Bên cạnh việc đào tạo cái gọi là mô hình ngôn ngữ lớn đằng sau các dịch vụ như vậy, công việc suy luận - hoặc chạy các mô hình để tạo ra kết quả - cũng đòi hỏi tính toán. Các thiết bị cầm tay thiếu bộ nhớ để chứa các mẫu lớn như mẫu đằng sau ChatGPT, cũng như sức mạnh xử lý cần thiết để chạy chúng.
Tạo phản hồi cho một truy vấn trên thiết bị, thay vì đợi trung tâm dữ liệu từ xa đưa ra kết quả, cũng có thể giảm độ trễ khi sử dụng ứng dụng. Khi dữ liệu cá nhân của người dùng được sử dụng để tinh chỉnh các phản hồi chung, việc giữ tất cả quá trình xử lý trên thiết bị cầm tay cũng có thể nâng cao quyền riêng tư.
Hơn bất cứ điều gì, AI sáng tạo có thể giúp thực hiện các hoạt động thông thường trên điện thoại thông minh dễ dàng hơn, chẳng hạn như khi nói đến những thứ liên quan đến sản xuất văn bản.
Theo Arvind Krishna, giám đốc điều hành của IBM, hầu hết các công ty muốn sử dụng AI tổng quát trong các dịch vụ của riêng họ sẽ nhận được nhiều thứ họ cần, bằng cách kết hợp một số mô hình nhỏ hơn này. Một số mô hình nhỏ hơn đã thể hiện khả năng đáng ngạc nhiên. Chúng bao gồm LLaMa, một mô hình ngôn ngữ nguồn mở do Meta phát hành, được cho là phù hợp với nhiều tính năng của các hệ thống lớn nhất.
LLaMa có nhiều kích cỡ khác nhau, nhỏ nhất chỉ có 7 tỷ tham số, ít hơn nhiều so với 175 tỷ của GPT-3, mô hình ngôn ngữ đột phá OpenAI được phát hành vào năm 2020; số lượng tham số trong GPT-4, được phát hành trong năm nay, vẫn chưa được tiết lộ. Một mô hình nghiên cứu dựa trên LLaMa và được phát triển tại Đại học Stanford đã được hiển thị chạy trên một trong các thiết bị cầm tay Pixel 6 của Google.
Ngoài kích thước nhỏ hơn nhiều, bản chất nguồn mở của các mô hình như thế này cũng giúp các nhà nghiên cứu và nhà phát triển dễ dàng điều chỉnh chúng cho các môi trường máy tính khác nhau. Qualcomm vào đầu năm nay đã trình diễn những gì họ tuyên bố là chiếc điện thoại Android đầu tiên chạy mô hình tạo hình ảnh của Stable Diffusion, có khoảng 1 tỷ thông số. Ziad Asghar, phó chủ tịch cấp cao của Qualcomm cho biết, nhà sản xuất chip đã "lượng tử hóa" hoặc cắt giảm kích thước của mô hình để chạy nó dễ dàng hơn trên thiết bị cầm tay mà không làm mất đi bất kỳ độ chính xác nào.
Túi tiền đổ vào AI sáng tạo bắt đầu tăng tốc
Ben Bajarin, nhà phân tích của Creative Strategies cho biết, hầu hết công việc điều chỉnh các mẫu cho phù hợp với thiết bị cầm tay vẫn đang ở giai đoạn thử nghiệm, nên còn quá sớm để đánh giá liệu những nỗ lực này có dẫn đến các ứng dụng di động thực sự hữu ích hay không. Ông dự đoán các ứng dụng tương đối thô sơ, chẳng hạn như chức năng chỉnh sửa ảnh được điều khiển bằng giọng nói và trả lời câu hỏi đơn giản, từ làn sóng đầu tiên của các mẫu di động có thông số từ 1 tỷ đến 10 tỷ.
Zoubin Ghahramani, phó chủ tịch của Google DeepMind, bộ phận nghiên cứu AI của công ty internet, cho biết mẫu điện thoại di động Gecko của họ có thể xử lý 16 mã thông báo mỗi giây – một thước đo dựa trên số lượng đơn vị văn bản ngắn mà các mô hình ngôn ngữ lớn hoạt động. Hầu hết các mô hình lớn sử dụng một đến hai mã thông báo cho mỗi từ được tạo, cho thấy rằng Gecko có thể tạo ra khoảng 10 đến 15 từ mỗi giây trên thiết bị cầm tay, phù hợp để đề xuất tin nhắn văn bản hoặc phản hồi email ngắn.
Tốc độ ngạc nhiên của AI sáng tạo bắt đầu chuyển sang điện thoại thông minh đã thu hút sự chú ý vào Apple, công ty cho đến nay vẫn đứng ngoài làn sóng đầu cơ xung quanh công nghệ.
Hội nghị các nhà phát triển toàn cầu của Apple sẽ bắt đầu vào ngày 5/6, trước sự kiện riêng của Microsoft dành cho các nhà phát triển có tên Build. Cuộc chiến giành sự chú ý của các nhà phát triển sắp trở nên gay gắt. AI sáng tạo có thể vẫn còn ở giai đoạn sơ khai, nhưng cơn sốt để tiếp cận nhiều người dùng hơn - và túi tiền đổ vào AI sáng tạo - đã bắt đầu tăng tốc.