Góc tư vấn

NĂM 2026, AI SẼ CHUYỂN TỪ SỰ THỔI PHỒNG SANG CHỦ NGHĨA THỰC DỤNG – Lm. Anmai, CSsR

NĂM 2026, AI SẼ CHUYỂN TỪ SỰ THỔI PHỒNG SANG CHỦ NGHĨA THỰC DỤNG – Lm. Anmai, CSsR

Nếu năm 2025 là năm AI được kiểm tra vibe, thì năm 2026 sẽ là năm công nghệ trở nên thực tế. Trọng tâm đã chuyển dịch khỏi việc xây dựng các mô hình ngôn ngữ lớn hơn bao giờ hết và hướng tới công việc khó khăn hơn là làm cho AI trở nên hữu dụng. Trong thực tế, điều đó liên quan đến việc triển khai các mô hình nhỏ hơn ở nơi phù hợp, nhúng trí thông minh vào các thiết bị vật lý, và thiết kế các hệ thống tích hợp mượt mà vào quy trình làm việc của con người.

Các chuyên gia mà TechCrunch đã nói chuyện thấy năm 2026 như một năm chuyển tiếp, một năm phát triển từ việc mở rộng quy mô thô bạo sang nghiên cứu các kiến trúc mới, từ các bản demo hào nhoáng sang các triển khai nhắm mục tiêu, và từ các agent hứa hẹn sự tự chủ sang những agent thực sự tăng cường cách con người làm việc.

Bữa tiệc chưa kết thúc, nhưng ngành công nghiệp đang bắt đầu tỉnh táo trở lại.

Vào năm 2012, bài báo ImageNet của Alex Krizhevsky, Ilya Sutskever và Geoffrey Hinton đã cho thấy cách các hệ thống AI có thể “học” để nhận diện các vật thể trong hình ảnh bằng cách xem hàng triệu ví dụ. Phương pháp này tốn kém về tính toán, nhưng có thể thực hiện được nhờ GPU. Kết quả? Một thập kỷ nghiên cứu AI hardcore khi các nhà khoa học làm việc để phát minh ra các kiến trúc mới cho các nhiệm vụ khác nhau.

Điều đó đạt đỉnh điểm vào khoảng năm 2020 khi OpenAI ra mắt GPT-3, cho thấy cách chỉ cần làm mô hình lớn hơn 100 lần sẽ mở khóa các khả năng như lập trình và suy luận mà không cần đào tạo rõ ràng. Điều này đánh dấu sự chuyển tiếp sang cái mà Kian Katanforoosh, CEO và người sáng lập nền tảng agent AI Workera, gọi là “thời đại mở rộng”: một giai đoạn được định nghĩa bởi niềm tin rằng nhiều tính toán hơn, nhiều dữ liệu hơn và các mô hình transformer lớn hơn sẽ không thể tránh khỏi dẫn đến các đột phá lớn tiếp theo trong AI.

Ngày nay, nhiều nhà nghiên cứu nghĩ rằng ngành AI đang bắt đầu cạn kiệt giới hạn của quy luật mở rộng và sẽ một lần nữa chuyển tiếp sang thời đại nghiên cứu.

Yann LeCun, cựu trưởng khoa học AI của Meta, từ lâu đã lập luận chống lại sự phụ thuộc quá mức vào mở rộng, và nhấn mạnh nhu cầu phát triển các kiến trúc tốt hơn. Và Sutskever nói trong một cuộc phỏng vấn gần đây rằng các mô hình hiện tại đang đạt đến mức ổn định và kết quả tiền đào tạo đã phẳng lì, cho thấy nhu cầu về các ý tưởng mới.

“Tôi nghĩ rất có thể trong vòng 5 năm tới, chúng ta sẽ tìm ra một kiến trúc tốt hơn là một cải tiến đáng kể so với transformer,” Katanforoosh nói. “Và nếu chúng ta không làm được, chúng ta không thể mong đợi nhiều cải thiện trên các mô hình.”

Các mô hình ngôn ngữ lớn rất giỏi trong việc tổng quát hóa kiến thức, nhưng nhiều chuyên gia nói rằng làn sóng tiếp theo của việc áp dụng AI doanh nghiệp sẽ được thúc đẩy bởi các mô hình ngôn ngữ nhỏ hơn, linh hoạt hơn có thể được tinh chỉnh cho các giải pháp cụ thể theo lĩnh vực.

“Các SLM được tinh chỉnh sẽ là xu hướng lớn và trở thành một yếu tố chính được sử dụng bởi các doanh nghiệp AI trưởng thành vào năm 2026, vì lợi thế về chi phí và hiệu suất sẽ thúc đẩy việc sử dụng chúng hơn các LLM sẵn có,” Andy Markus, giám đốc dữ liệu chính của AT&T, nói với TechCrunch. “Chúng tôi đã thấy các doanh nghiệp ngày càng phụ thuộc vào SLM vì, nếu được tinh chỉnh đúng cách, chúng khớp với các mô hình lớn hơn, tổng quát hơn về độ chính xác cho các ứng dụng kinh doanh doanh nghiệp, và vượt trội về chi phí và tốc độ.”

Chúng tôi đã thấy lập luận này trước đây từ startup AI mã nguồn mở Pháp Mistral: Nó lập luận rằng các mô hình nhỏ của họ thực sự hoạt động tốt hơn các mô hình lớn hơn trên một số benchmark sau khi tinh chỉnh.

“Hiệu quả, tính kinh tế và khả năng thích ứng của SLM làm chúng lý tưởng cho các ứng dụng tùy chỉnh nơi độ chính xác là tối quan trọng,” Jon Knisley, một chiến lược gia AI tại ABBYY, một công ty AI doanh nghiệp có trụ sở tại Austin, nói.

Trong khi Markus nghĩ SLM sẽ là chìa khóa trong kỷ nguyên agentic, Knisley nói rằng bản chất của các mô hình nhỏ nghĩa là chúng tốt hơn cho việc triển khai trên các thiết bị cục bộ, “một xu hướng được thúc đẩy bởi các tiến bộ trong edge computing.”

Con người không chỉ học qua ngôn ngữ; chúng ta học bằng cách trải nghiệm cách thế giới hoạt động. Nhưng LLM không thực sự hiểu thế giới; chúng chỉ dự đoán từ hoặc ý tưởng tiếp theo. Đó là lý do tại sao nhiều nhà nghiên cứu tin rằng bước nhảy vọt lớn tiếp theo sẽ đến từ các mô hình thế giới: các hệ thống AI học cách các vật thể di chuyển và tương tác trong không gian 3D để chúng có thể đưa ra dự đoán và thực hiện hành động.

Các dấu hiệu cho thấy năm 2026 sẽ là năm lớn cho các mô hình thế giới đang nhân lên. LeCun rời Meta để khởi động phòng thí nghiệm mô hình thế giới của riêng mình và được cho là đang tìm kiếm định giá 5 tỷ đô la. DeepMind của Google đã cắm đầu vào Genie và vào tháng 8 đã ra mắt mô hình mới nhất xây dựng các mô hình thế giới đa năng tương tác thời gian thực. Bên cạnh các bản demo từ các startup như Decart và Odyssey, World Labs của Fei-Fei Li đã ra mắt mô hình thế giới thương mại đầu tiên, Marble. Các tân binh như General Intuition vào tháng 10 đã nhận được vòng seed 134 triệu đô la để dạy các agent lý luận không gian bằng cách sử dụng các clip trò chơi video, và startup tạo video Runway vào tháng 12 đã phát hành mô hình thế giới đầu tiên, GWM-1.

Trong khi các nhà nghiên cứu thấy tiềm năng dài hạn trong robot và tự chủ, tác động gần hạn có lẽ sẽ được thấy đầu tiên trong trò chơi video. PitchBook dự đoán thị trường cho các mô hình thế giới trong gaming có thể tăng từ 1,2 tỷ đô la giữa năm 2022 và 2025 lên 276 tỷ đô la vào năm 2030, được thúc đẩy bởi khả năng tạo ra các thế giới tương tác và các nhân vật không chơi giống thật hơn của công nghệ.

Pim de Witte, người sáng lập General Intuition, nói với TechCrunch rằng các môi trường ảo không chỉ có thể định hình lại gaming, mà còn trở thành các sân thử nghiệm quan trọng cho thế hệ mô hình nền tảng tiếp theo.

Các agent không đáp ứng được sự thổi phồng vào năm 2025, nhưng một lý do lớn là vì khó kết nối chúng với các hệ thống nơi công việc thực sự diễn ra. Không có cách nào để truy cập công cụ và ngữ cảnh, hầu hết các agent bị kẹt trong các quy trình thử nghiệm.

Model Context Protocol (MCP) của Anthropic, một “USB-C cho AI” cho phép các agent AI nói chuyện với các công cụ bên ngoài như cơ sở dữ liệu, công cụ tìm kiếm và API, đã chứng minh là mô liên kết thiếu và đang nhanh chóng trở thành tiêu chuẩn. OpenAI và Microsoft đã công khai chấp nhận MCP, và Anthropic gần đây đã tặng nó cho Agentic AI Foundation mới của Linux Foundation, nhằm giúp chuẩn hóa các công cụ agentic mã nguồn mở. Google cũng đã bắt đầu thiết lập các máy chủ MCP được quản lý của riêng mình để kết nối các agent AI với sản phẩm và dịch vụ của mình.

Với MCP giảm ma sát trong việc kết nối các agent với các hệ thống thực tế, năm 2026 có lẽ sẽ là năm các quy trình agentic cuối cùng chuyển từ demo sang thực tiễn hàng ngày.

Rajeev Dham, một đối tác tại Sapphire Ventures, nói rằng những tiến bộ này sẽ dẫn đến các giải pháp agent-first đảm nhận “vai trò hệ thống ghi chép” trên các ngành công nghiệp.

“Khi các agent giọng nói xử lý nhiều nhiệm vụ end-to-end hơn như intake và giao tiếp khách hàng, chúng cũng sẽ bắt đầu hình thành các hệ thống cốt lõi cơ bản,” Dham nói. “Chúng ta sẽ thấy điều này ở nhiều lĩnh vực như dịch vụ gia đình, proptech và y tế, cũng như các chức năng ngang như bán hàng, IT và hỗ trợ.”

Trong khi các quy trình agentic hơn có thể làm dấy lên lo ngại rằng sa thải có thể theo sau, Katanforoosh của Workera không chắc chắn rằng đó là thông điệp: “Năm 2026 sẽ là năm của con người,” anh ấy nói.

Vào năm 2024, mọi công ty AI đều dự đoán họ sẽ tự động hóa công việc mà không cần con người. Nhưng công nghệ chưa đạt đến đó, và trong một nền kinh tế không ổn định, đó không thực sự là một lời nói phổ biến. Katanforoosh nói rằng năm tới, chúng ta sẽ nhận ra rằng “AI chưa hoạt động tự chủ như chúng ta nghĩ,” và cuộc trò chuyện sẽ tập trung nhiều hơn vào cách AI được sử dụng để tăng cường quy trình làm việc của con người, thay vì thay thế chúng.

“Và tôi nghĩ nhiều công ty sẽ bắt đầu tuyển dụng,” anh ấy bổ sung, lưu ý rằng anh ấy mong đợi sẽ có các vai trò mới trong quản trị AI, minh bạch, an toàn và quản lý dữ liệu. “Tôi khá lạc quan về tỷ lệ thất nghiệp trung bình dưới 4% vào năm tới.”

“Con người muốn ở trên API, không phải dưới nó, và tôi nghĩ năm 2026 là năm quan trọng cho điều này,” de Witte bổ sung.

Các tiến bộ trong công nghệ như mô hình nhỏ, mô hình thế giới và edge computing sẽ cho phép nhiều ứng dụng vật lý hơn của machine learning, các chuyên gia nói.

“AI vật lý sẽ trở thành主流 vào năm 2026 khi các loại thiết bị được hỗ trợ bởi AI mới, bao gồm robot, AV, drone và thiết bị đeo bắt đầu thâm nhập thị trường,” Vikram Taneja, trưởng AT&T Ventures, nói với TechCrunch.

Trong khi xe tự lái và robot là các trường hợp sử dụng rõ ràng cho AI vật lý sẽ tiếp tục phát triển vào năm 2026, đào tạo và triển khai cần thiết vẫn còn đắt đỏ. Thiết bị đeo, mặt khác, cung cấp một cách tiếp cận ít tốn kém hơn với sự chấp nhận của người tiêu dùng. Kính thông minh như Ray-Ban Meta đang bắt đầu xuất xưởng các trợ lý có thể trả lời câu hỏi về những gì bạn đang nhìn, và các hình thức mới như vòng sức khỏe được hỗ trợ bởi AI và đồng hồ thông minh đang bình thường hóa suy luận luôn bật, trên cơ thể.

“Các nhà cung cấp kết nối sẽ làm việc để tối ưu hóa cơ sở hạ tầng mạng của họ để hỗ trợ làn sóng thiết bị mới này, và những người có sự linh hoạt trong cách họ cung cấp kết nối sẽ được định vị tốt nhất,” Taneja nói.

Lm. Anmai, CSsR

Bài viết liên quan

Back to top button
error: Content is protected !!