Hai mô hình mang tên MAI-Voice-1 AI và MAI-1-preview cho thấy công ty không còn hoàn toàn phụ thuộc vào OpenAI, đối tác chiến lược nhưng ngày càng có nhiều dấu hiệu trở thành đối thủ cạnh tranh trực tiếp.
MAI-Voice-1 và khả năng xử lý giọng nói vượt trội
Nổi bật trong số này là MAI-Voice-1, một mô hình AI tập trung vào xử lý giọng nói. Microsoft cho biết MAI-Voice-1 có khả năng tạo ra một phút âm thanh chỉ trong chưa đầy một giây, và đặc biệt chỉ cần đến một GPU duy nhất. Đây là con số ấn tượng khi đặt cạnh nhiều mô hình giọng nói hiện tại vốn cần đến hạ tầng tính toán phức tạp hơn rất nhiều.
Mô hình này đã được tích hợp vào một số sản phẩm của Microsoft. Trong đó có Copilot Daily, tính năng mới đóng vai trò như một người dẫn chương trình AI đọc bản tin hằng ngày, cùng với công cụ podcast thảo luận giúp tự động tạo các cuộc trò chuyện để giải thích những chủ đề khó.
Người dùng cũng có thể trải nghiệm trực tiếp trên Copilot Labs, nơi cho phép nhập văn bản để AI phát lại bằng giọng nói và tùy chỉnh phong cách cũng như giọng đọc theo nhu cầu. Điều này mở ra nhiều ứng dụng thực tiễn từ hỗ trợ học ngoại ngữ, sản xuất podcast đến cá nhân hóa trải nghiệm giải trí.
MAI-1-preview và định hình nền tảng Copilot thế hệ mới
Song song với MAI-Voice-1, Microsoft còn công bố MAI-1-preview, mô hình ngôn ngữ mới được huấn luyện trên khoảng 15.000 GPU Nvidia H100. Đây là loại GPU chuyên dụng hàng đầu cho trí tuệ nhân tạo, phản ánh khoản đầu tư khổng lồ của Microsoft vào dự án.
Không giống như MAI-Voice-1 tập trung vào âm thanh, MAI-1-preview được thiết kế để xử lý văn bản, với khả năng làm theo hướng dẫn và đưa ra câu trả lời hữu ích cho những câu hỏi thường ngày. Microsoft đã bắt đầu thử nghiệm mô hình này trong nhiều tác vụ văn bản của Copilot, lĩnh vực vốn trước đây gần như hoàn toàn dựa trên công nghệ của OpenAI.
Định hướng tập trung vào người dùng cá nhân
Mustafa Suleyman, Giám đốc bộ phận AI của Microsoft và là đồng sáng lập DeepMind, nhấn mạnh rằng chiến lược của công ty hướng đến việc phát triển mô hình AI phục vụ trực tiếp người dùng cá nhân thay vì tập trung vào giải pháp doanh nghiệp.
Ông khẳng định mục tiêu là tạo ra những công cụ vận hành cực kỳ hiệu quả, tối ưu cho các tình huống sử dụng thực tế. Microsoft sở hữu nguồn dữ liệu khổng lồ từ quảng cáo và hành vi người dùng, và chính điều này trở thành nền tảng để xây dựng các mô hình AI mang tính bạn đồng hành số thực sự.
Định hướng đó lý giải vì sao MAI-Voice-1 và MAI-1-preview được tích hợp ngay vào Copilot, công cụ AI đang phục vụ hàng trăm triệu người dùng Windows, Office và các dịch vụ đám mây.
Quan hệ giữa Microsoft và OpenAI vốn được xem là hợp tác chiến lược, khi Microsoft rót hàng tỷ USD vào OpenAI và đưa GPT vào Copilot. Tuy nhiên, việc Microsoft tự phát triển và trực tiếp triển khai mô hình của riêng mình cho thấy dấu hiệu cạnh tranh ngày càng rõ rệt.
Trong thông báo chính thức, Microsoft khẳng định tham vọng không chỉ dừng lại ở cải tiến công nghệ mà còn hướng tới xây dựng một hệ thống đa mô hình, phục vụ nhiều mục đích khác nhau và mang lại giá trị lớn cho người dùng. Điều này đồng nghĩa Microsoft sẽ không còn phụ thuộc vào OpenAI, mà từng bước định hình một hệ sinh thái AI tự chủ và đa dạng.
Việc ra mắt MAI-Voice-1 và MAI-1-preview mở ra nhiều tác động đáng chú ý. Với người dùng cá nhân, Copilot sẽ trở nên hữu ích hơn, không chỉ trả lời câu hỏi mà còn giao tiếp bằng giọng nói tự nhiên. Với thị trường trí tuệ nhân tạo, sự xuất hiện của Microsoft như một đối trọng sẽ khiến cuộc cạnh tranh cùng OpenAI, DeepSeek và các tên tuổi khác trở nên gay gắt hơn, thúc đẩy tốc độ đổi mới công nghệ.
Về lâu dài, dù Microsoft hiện tập trung vào trải nghiệm cá nhân, các mô hình này có tiềm năng mở rộng để phục vụ cả lĩnh vực thương mại và doanh nghiệp.
XEM THÊM:
Nghiên cứu mới cho thấy AI đang thay đổi cấu trúc việc làm toàn cầu
Tương Lai Bán Hàng Với Chatbot AI Rosa Thay Thế Con Người
ChatGPT Plus 3 Tháng Free Cho Thành Viên Shopee VIP
NGUỒN: 9to5Mac
Nguồn: Tinhte.vn