Sự thay đổi nhanh chóng này làm nổi bật sự nhiệt tình và mối lo xung quanh việc xây dựng và thương mại hóa các hệ thống trí tuệ nhân tạo tiên tiến. Mistral AI đang phá vỡ khuôn mẫu và thách thức sự thống trị của những gã khổng lồ trong ngành công nghệ Hoa Kỳ. Sau khi rời Google, ông Arthur Mensch đã thành lập Mistral AI cùng với hai người bạn từ trường kỹ thuật, với niềm tin rằng quy mô khổng lồ không phải là chìa khóa và Hoa Kỳ không phải là người dẫn đầu tất yếu.
Ông Mensch đã chia sẻ rằng: “Tôi luôn than thở về việc thiếu các công ty công nghệ lớn ở châu Âu và tôi nghĩ đây là cơ hội tuyệt vời để chúng tôi nằm trong số đó”.
Đến nay, sau 9 tháng thành lập, công ty đã đạt định giá khoảng 2 tỷ USD.
Sự ra đời của Mistral AI
Công ty của Mensch thành lập vào tháng 4/2023, huy động được hơn 500 triệu USD từ các nhà đầu tư, trong đó có công ty đầu tư mạo hiểm Andreessen Horowitz ở Thung lũng Silicon, mặc dù họ vẫn còn nhỏ so với những gã khổng lồ trong ngành. OpenAI được Microsoft hậu thuẫn đang đầu tư hàng tỷ USD vào việc đào tạo các hệ thống trí tuệ nhân tạo mới nhất, sử dụng chip máy tính chuyên dụng và nguồn tài chính dồi dào để hỗ trợ hoạt động của các hệ thống này. Mistral được thành lập một phần vì lo ngại về việc lãng phí nhiều tiền.
Ông Mensch là nhà tiên phong về công nghệ với nền tảng học thuật và vẫn đang khám phá cách nâng cao hiệu quả của hệ thống trí tuệ nhân tạo và máy học. Ông bắt đầu kinh doanh vào đầu năm ngoái với Timothée Lacroix, 32 tuổi và Guillaume Lample, 33 tuổi, người trước đây làm việc tại phòng thí nghiệm trí tuệ nhân tạo của Meta ở Paris.
Ba người họ đồng sáng lập Mistral AI, với hy vọng thách thức những gã khổng lồ công nghệ ở Thung lũng Silicon bằng cách xây dựng và triển khai hệ thống trí tuệ nhân tạo theo cách hiệu quả hơn. Ông cho biết: "Chúng tôi cam kết trở thành công ty sử dụng vốn hiệu quả nhất trong lĩnh vực trí tuệ nhân tạo. Đây là lý do cơ bản cho sự tồn tại của chúng tôi." Để đạt được mục tiêu này, họ quyết định cung cấp nhiều hệ thống trí tuệ nhân tạo cho công chúng dưới dạng phần mềm nguồn mở .
Mới đây, Mistral AI đã ra mắt mô hình trí tuệ nhân tạo mới, Mistral Large. Mensch cho biết hiệu suất của mô hình này tốt ngang với các mô hình tiên tiến như GPT-4 của OpenAI và Gemini Ultra của Google khi thực hiện một số tác vụ suy luận nhất định. Tuy nhiên, chi phí đào tạo của Mistral Large tương đối thấp, chỉ 20 triệu euro (khoảng 22 triệu USD). Trong khi đó, Giám đốc điều hành OpenAI Sam Altman cho biết vào năm ngoái sau khi phát hành GPT-4, chi phí đào tạo các mô hình lớn nhất của công ty "vượt xa" từ 50 triệu đến 100 triệu USD.
Lợi thế về chi phí của Mistral AI trong lĩnh vực trí tuệ nhân tạo đã thu hút sự chú ý rộng rãi. Là một trong những khách hàng và nhà đầu tư của Mistral AI, Microsoft tỏ ra rất quan tâm đến mô hình Mistral Large. Microsoft có kế hoạch tích hợp mô hình mới này vào dịch vụ đám mây Azure của mình để cung cấp cho các nhà phát triển nhiều sự lựa chọn hơn. Đồng thời, Microsoft sẽ nắm giữ một lượng nhỏ cổ phần trong công ty như một phần của thỏa thuận kéo dài nhiều năm.
Ngoài ra, Mistral AI còn có quan hệ đối tác với các công ty khác, bao gồm cả gã khổng lồ phần mềm doanh nghiệp Salesforce và nhà sản xuất GPU Nvidia.
Brian Bondy, Đồng sáng lập và Giám đốc công nghệ của Brave Software, đánh giá cao mô hình nguồn mở của Mistral AI. Ông cho biết công ty đã biến mô hình nguồn mở của Mistral thành mô hình mặc định cho chatbot trong trình duyệt web của mình. Ông tin rằng mô hình này có chất lượng tương đương với các mô hình độc quyền và mô hình nguồn mở mang lại cho Brave tính linh hoạt và khả năng kiểm soát cục bộ cao hơn.
Eric Boyd, Phó Chủ tịch nền tảng trí tuệ nhân tạo của Microsoft, đánh giá cao Mistral AI: "Mistral là một nỗ lực thú vị nhằm khám phá xem kỹ thuật thông minh có thể đẩy các hệ thống trí tuệ nhân tạo đi xa đến mức nào. Tiềm năng tăng trưởng của công ty mới nổi này rất hấp dẫn và chúng tôi rất vui mừng muốn xem họ sẽ đi đâu."
Con đường phát triển của Arthur Mensch
Arthur Mensch lớn lên ở vùng ngoại ô phía tây Paris, mẹ anh là giáo viên vật lý và cha ông điều hành một công ty công nghệ nhỏ. Trong quá trình học, Mensch tỏ ra rất yêu thích toán học và học máy. Cố vấn của ông cũng từng hết lời khen ngợi ông vì đã nhanh chóng tham gia vào các dự án và trở thành người lãnh đạo dự án, ngay cả khi ông thiếu kiến thức nền tảng liên quan. Bản thân Mensch cũng nói: "Tôi rất thích những thử thách mới, nhưng tôi rất nhanh chán."
Trong thời gian học Tiến sĩ, ông Mensch đã nghiên cứu cách mở rộng phần mềm phân tích hình ảnh não ba chiều để nó có thể xử lý hàng triệu mạng ánh xạ hình ảnh não từ hệ thống chụp ảnh cộng hưởng từ chức năng (fMRI). Nghiên cứu này có ý nghĩa quan trọng trong việc tìm hiểu cách não xử lý các vấn đề và chức năng toán học như nhận dạng khuôn mặt.
Vào cuối năm 2020, Mensch gia nhập bộ phận trí tuệ nhân tạo của Google, DeepMind, nơi ông tham gia xây dựng các mô hình ngôn ngữ lớn mà sau này hỗ trợ ChatGPT. Năm 2022, Mensch trở thành một trong những tác giả chính của bài nghiên cứu về “Mô hình trí tuệ nhân tạo mới Chinchilla”. Bài viết này thay đổi cách hiểu về mối quan hệ giữa kích thước của mô hình AI, lượng dữ liệu cần thiết và hiệu suất, được gọi là quy luật mở rộng của AI.
Sarah Guo, một nhà đầu tư ban đầu của công ty đầu tư mạo hiểm Conviction, đã đánh giá cao Mensch: “Ai có đủ khả năng để thách thức sự hiểu biết của thế giới về quy luật chia tỷ lệ hơn người đã định nghĩa nó?”
Khi sự cạnh tranh trong lĩnh vực trí tuệ nhân tạo ngày càng gay gắt vào năm 2022, Mensch thất vọng vì số lượng tài liệu nghiên cứu về các mô hình ngôn ngữ lớn được xuất bản bởi các phòng thí nghiệm trí tuệ nhân tạo tư nhân lớn đã bắt đầu giảm và chúng ngày càng ít được chia sẻ với cộng đồng nghiên cứu rộng lớn hơn. .
Ngoài ra, sự ra mắt của ChatGPT đã gây ra sự cạnh tranh khốc liệt trong nội bộ Google. Đối mặt với thách thức này, nhóm của Mensch đã mở rộng nhanh chóng, từ 10 người ban đầu lên 30 người và cuối cùng lên 70 người. Tuy nhiên, Mensch không hài lòng khi làm việc trong một công ty công nghệ lớn.
Ngoài việc tập trung vào đổi mới công nghệ và phát triển ngành, Mensch còn tích cực tham gia vào các cuộc thảo luận chính sách. Ông đã vận động các nhà hoạch định chính sách của Pháp, bao gồm cả Tổng thống Emmanuel Macron, chống lại một số điều khoản trong dự luật trí tuệ nhân tạo mới của EU. Ông tin rằng những quy định này có thể cản trở tốc độ phát triển của công ty và gây bất lợi cho việc cải thiện tính an toàn của trí tuệ nhân tạo. Sau khi những thay đổi được thực hiện đối với văn bản của dự luật ở Brussels, ông tin rằng đó sẽ là một gánh nặng có thể quản lý được đối với Mistral. Tuy nhiên, ông khẳng định luật pháp nên tập trung nhiều hơn vào cách sử dụng AI, thay vì quản lý quá mức công nghệ cơ bản.
Đối với Mensch và những người đồng sáng lập của ông, nguyên tắc quan trọng là phát hành hệ thống AI ban đầu dưới dạng phần mềm nguồn mở, giúp mọi người sử dụng hoặc sửa đổi nó miễn phí. Chiến lược mở này được thiết kế để thu hút một lượng lớn các nhà phát triển và khách hàng tiềm năng, những người mong muốn có nhiều quyền kiểm soát hơn đối với AI mà họ sử dụng. Tuy nhiên, mô hình tiên tiến nhất của Mistral không phải là nguồn mở.