Trong khi ngành công nghệ đang chuyển dịch sang các trình duyệt có khả năng tự tác nghiệp (agentic browsers) và các trợ lý AI giống con người hơn – như Atlas mới của OpenAI hay các mô hình Claude mới nhất của Anthropic – Microsoft vẫn muốn Copilot trở thành trợ lý cốt lõi mà mọi người tin dùng cho công việc, học tập và các tác vụ kỹ thuật số hàng ngày. Liệu Mico có thành công nơi mà Clippy và Cortana đã thất bại hay không sẽ phụ thuộc vào việc người dùng đón nhận ý tưởng trò chuyện với một chiếc máy tính biết đối đáp – và ghi nhớ mọi điều bạn nói – một cách tự nhiên đến mức nào.
Microsoft vừa phát hành các bản cập nhật lớn cho trợ lý kỹ thuật số Copilot của mình, bao gồm sự ra mắt của Mico – một hình đại diện hoạt hình (animated avatar) mang đến cho AI một nét nhân văn bằng cách phản ứng với các biểu cảm theo thời gian thực trong các tương tác bằng giọng nói.
Mico và bộ nhớ dài hạn: Khi Copilot “thấu hiểu” người dùng
Bản cập nhật đi kèm với các tính năng mới giúp trợ lý này tương tác hơn và phù hợp hơn cho việc cộng tác. Giờ đây, người dùng có thể làm việc trong các không gian được chia sẻ gọi là Groups, cho phép tối đa 32 người tham gia cùng chỉnh sửa tài liệu, động não ý tưởng và quản lý các dự án đang diễn ra. Khả năng bộ nhớ dài hạn mới của trợ lý cho phép nó lưu giữ các chi tiết về nhiệm vụ, danh sách và sở thích, giúp Copilot gợi lại các cuộc trò chuyện trước đó và tham chiếu thông tin khi người dùng quay lại một dự án.
“Việc có bộ nhớ là hoàn toàn thiết yếu đối với một người bạn đồng hành,” Ella Steckler, Giám đốc sản phẩm AI tại Microsoft, cho biết. “Với bộ nhớ dài hạn của Copilot, nó sẽ tự nhiên nắm bắt được các chi tiết quan trọng và ghi nhớ chúng rất lâu sau khi bạn kết thúc cuộc trò chuyện.”
Microsoft đã mở rộng khả năng đa nền tảng của Copilot để bao gồm Outlook và các ứng dụng năng suất của Google. Trong trình duyệt Edge của hãng, Copilot có thể, với sự cho phép của người dùng, truy cập các tab trình duyệt, tóm tắt và so sánh thông tin, và thậm chí thực hiện các tác vụ như đặt vé du lịch. Các tìm kiếm trong quá khứ cũng có thể được sắp xếp thành các “storylines” (cốt truyện), cho phép người dùng xem lại các chủ đề hoặc dự án cũ.
Các tính năng mới, được cung cấp đầu tiên cho người dùng tại Hoa Kỳ, sẽ được triển khai tới Vương quốc Anh, Canada, và các khu vực khác trong những tuần tới. Microsoft cho biết họ cũng đã cải thiện cách Copilot xử lý các câu hỏi liên quan đến sức khỏe, đặt trọng tâm lớn hơn vào việc lấy nguồn từ thông tin y tế đáng tin cậy để chống lại nguy cơ thông tin sai lệch.
Sự trở lại của trợ lý ảo và bài học từ Clippy, Cortana
Cải tiến đáng chú ý nhất chính là Mico, hình đại diện ảo mang lại cho Copilot một sự hiện diện cá nhân và biểu cảm hơn trong các cuộc trò chuyện. Nhân vật hoạt hình này, với cái tên chơi chữ từ “Microsoft Copilot,” thể hiện cảm xúc và thay đổi màu sắc khi trò chuyện với người dùng. Jacob Andreou, Phó Chủ tịch công ty về sản phẩm và tăng trưởng AI của Microsoft, nói với The Verge: “Đó là thứ bạn có thể nhìn thấy, thứ phản ứng khi bạn nói chuyện với nó. Nếu bạn nói về điều gì đó buồn bã, bạn sẽ thấy biểu cảm khuôn mặt của nó phản ứng gần như ngay lập tức. Tất cả công nghệ mờ dần vào nền, và bạn chỉ bắt đầu nói chuyện với quả cầu dễ thương này và xây dựng kết nối với nó.”
Mico hoạt động chủ yếu ở chế độ giọng nói và được bật mặc định cho người dùng Mỹ. Nó dựa vào khả năng bộ nhớ mới của Copilot để gợi lại các chi tiết cá nhân và thông tin ngữ cảnh từ các tương tác trong quá khứ. Microsoft cũng đang giới thiệu chế độ “Learn Live”, biến Mico thành một gia sư tương tác, sử dụng bảng trắng và các gợi ý trực quan để hướng dẫn người dùng qua các chủ đề như học ngôn ngữ hoặc ôn tập học thuật. Cách tiếp cận này dựa một phần vào đối thoại Socratic – khuyến khích sự tham gia thông qua các câu hỏi có hướng dẫn thay vì câu trả lời trực tiếp.
Mico là sự tiếp nối của các thử nghiệm trợ lý kỹ thuật số kéo dài của Microsoft. Gần ba thập kỷ trước, công ty đã giới thiệu Clippy trong Microsoft Office là một tính năng trợ giúp nhưng nhanh chóng trở nên tai tiếng vì sự ngắt lời khó chịu của nó. Một nỗ lực sau đó diễn ra vào năm 2014, khi Microsoft ra mắt Cortana cho Windows Phone và sau đó tích hợp vào PC Windows 10. Mặc dù có sự nhiệt tình ban đầu, Cortana chưa bao giờ được áp dụng rộng rãi và đã chính thức bị ngừng hỗ trợ cho Windows 11 vào năm 2023.
Lần này, Microsoft đang đặt cược rằng những tiến bộ trong các mô hình ngôn ngữ tự nhiên và hoạt hình thời gian thực sẽ giúp vượt qua thách thức dai dẳng là làm cho máy tính đàm thoại trở nên trực quan thay vì xâm phạm. “Clippy đã đi để chúng ta có thể chạy,” Andreou đùa. Công ty thậm chí còn để lại một sự gợi nhớ về lịch sử của mình được chôn giấu trong phần mềm mới – Andreou gợi ý có một Easter egg xuất hiện “nếu bạn chọc Mico rất, rất nhanh.”
Việc ra mắt Mico cũng phù hợp với tầm nhìn rộng lớn hơn được Giám đốc AI của Microsoft, Mustafa Suleyman, vạch ra hồi đầu năm. Suleyman cho biết Copilot sẽ phát triển một bản sắc hình ảnh và hành vi nhất quán – “một sự hiện diện” như ông mô tả – và nó sẽ tồn tại trong một môi trường được xác định và phát triển theo thời gian. Mico là một phần của chiến lược đó, mang lại cho trợ lý AI của Microsoft một bản sắc hình ảnh trong khi công ty tiếp thị PC Windows 11 là “chiếc máy tính bạn có thể nói chuyện cùng.” Chiến dịch này nhấn mạnh nỗ lực rộng lớn hơn của Microsoft nhằm bình thường hóa tương tác dựa trên giọng nói với máy tính, một khái niệm đã phải vật lộn để được chấp nhận trong kỷ nguyên Cortana nhưng giờ đây được hưởng lợi từ các công nghệ AI tạo sinh mạnh mẽ hơn rất nhiều.

