Chiến lược nào cho những nước không phát triển được LLMs như Việt Nam trong cuộc đua về AI?
Chiến lược nào cho Việt Nam nói riêng và những nước không có khả năng tạo ra mô hình LLMs ở tầm cỡ thi đấu quốc tế được. Nếu chiến lược chỉ để dẫn đầu ở khu vực Đông Nam Á thì cá nhân tôi thấy vô nghĩa, chả có gì đáng để nói ở cái ao làng này..
Khoảng chục năm trở về trước, những người làm AI như chúng tôi có thể bỏ ra vài ngàn đô la để mua GPU card của Nvidia về để huấn luyện mô hình AI cho các ứng dụng của mình. Vài ngàn đô là với các công ty lại càng là một con số nhỏ bé như muối bỏ bể.
2012-2015 là những năm tháng khởi đầu của Deep Learning với sự ra đời lần lượt của AlexNet (Hinton Lab), VGG (Oxford University), Inception (Google) và ResNet (Microsoft). Nếu các bạn để ý thì có thể thấy sự tiến hoá từ AlexNet đến ResNet nằm ở chỗ: mạng nơ ron càng sâu hay số lượng tham số càng nhiều thì độ chính xác của mô hình càng cao. Đó là xu hướng trong nghiên cứu Deep Learning kéo dài cho đến ngày hôm nay.
NVIDIA là tập đoàn cổ xuý cho xu hướng này bởi không ai khác, họ là người được hưởng lợi trực tiếp. Người người mua GPU, nhà nhà mua GPU và rồi sau vài năm phải lên đời cho GPU để theo kịp xu hướng. NVIDIA chả mấy chốc mà vượt mặt Intel và bây giờ là số 1 thế giới. Vấn đề này khỏi bàn cãi bởi vì các bạn cần phải biết rằng Deep Learning ra đời ở lab của cụ Hinton là nhờ bàn tay của NVIDIA. Cuộc chơi về AI này một phần do NVIDIA tạo ra thì lẽ tất nhiên họ phải là người được hưởng thành quả của sự phát triển thần kỳ này.
5 năm trở lại đây nghiên cứu và phát triển AI đã dần xa khỏi tầm tay của các trường Đại học, các công ty vừa và nhỏ, và rồi thậm chí công ty và tập đoàn lớn cũng dần dần đứng xa khỏi cuộc đua. Kể từ khi GPT3.5 ra đời vào cuối tháng 11 năm 2022, chúng ta chỉ còn thấy OpenAI, Meta, Anthropic, … các công ty AI startups trụ lại trong cuộc đua về AI. Vấn đề ở đây là gì?
Vấn đề mấu chốt là fundings. Đó là fundings để xây dựng GPU server siêu khủng. Bởi vì chi phí để huấn luyện LLM là rất lớn lên đến hàng chục và thậm chí hàng trăm triệu đô la. Đấy là chưa kể tiền chi cho GPU trong quá trình thử nghiệm và huấn luyện thất bại mà không được công bố. Tập đoàn lớn như Google, Meta, XAI của tỷ phú Elon Musk, … có nguồn tiền dồi dào để đầu tư. AI Startups thì gọi vốn từ các nhà đầu tư bên ngoài. Nó sẽ thu hút các nhà nghiên cứu xuất sắc trong lĩnh vực AI cũng như các giáo sư ở trường Đại học về làm cho họ.
Rõ ràng, chiến lược ở tầm quốc gia để leading thế giới về AI là leading về công nghệ LLMs và tiến một bước xa hơn nữa là AGI (Artificial General Intelligence). AI ở thời điểm hiện tại mới chỉ là LLMs và những phiên bản cải tiến của nó. Nó chưa phải là AGI. Để đạt được AGI, chúng ta cần phải chờ thêm khoảng trên dưới 10 năm nữa. Mỹ vẫn đang là lá cờ đầu trên toàn thế giới.
Nhật Bản đôi năm trở lại đây đã xuất hiện một vài công ty AI startups được hậu thuẫn bởi các tập đoàn lớn: SakanaAI (NTT) và Sambanova (Softbank) cũng đầu tư mạnh cả về nguồn lực con người và GPU server. Họ tung ra những mô hình LLMs được huấn luyện bằng dữ liệu tiếng Nhật. Cụ CEO của Sambanova đã từng nói chuyện với tôi về vấn đề giữa ngôn ngữ tiếng Nhật và văn hoá truyền thống Nhật Bản trong việc xây dựng mô hình LLMs cho riêng Nhật Bản. Nó phù hợp với chiến lược tự chủ công nghệ LLMs mà chính phủ Nhật đặt ra. Họ cho rằng mô hình LLMs được huấn luyện trên dữ liệu tiếng Nhật của họ xử lý tiếng Nhật tốt hơn nhiều so với các mô hình của phương Tây huấn luyện trên dữ liệu tiếng Anh.
Cách đây chưa đầy một tháng, DeepSeek của anh hàng xóm Trung Quốc nổi đình đám, khiến cho cổ phiếu AI startups ở Mỹ và NVIDIA tụt hơn 10%, thổi bay vài trăm tỷ đô la trong phút chốc ở phố Wall. Tôi có 1 bài đã nói riêng về thành công và sáng tạo của DeepSeek rồi. Các bạn có thể tìm trong post ngay phía dưới. Sự thành công của DeepSeek cho thấy Trung Quốc đang đua với Mỹ bằng sự sáng tạo trong toán học để vượt qua rào cản cấm vận phần cứng, bằng sự đầu tư của chính phủ và các nhà đầu tư nội địa, bằng sự nỗ lực của lực lượng nhân sự hùng hâụ thu thập và tiền xử lý dữ liệu cho việc huấn luyện, … Nó cho thấy khát vọng và vị trí địa chính trị của Trung Quốc trong việc đua tranh vị thế dẫn đầu trong lĩnh vực AI. Cá nhân tôi thấy rằng nếu không bị cấm vận thì Trung Quốc đã vượt xa Mỹ rồi. Nhớ lại hồi 2018 đi dự hội nghị CVPR ở Mỹ, các gian hàng trưng bầy của các tập đoàn lớn như Meta, Google, Microsoft, Amazon, … đều có biển flex số bài báo được đăng ở CVPR. Bên cạnh đó, các gian hàng của tập đoàn lớn của Trung Quốc như Tencent, Alibaba, Huawei, … đều có số lượng bài báo có phần nhỉnh hơn các công ty của Mỹ.
Vậy chiến lược nào cho Việt Nam nói riêng và những nước không có khả năng tạo ra mô hình LLMs ở tầm cỡ thi đấu quốc tế được. Nếu chiến lược chỉ để dẫn đầu ở khu vực Đông Nam Á thì cá nhân tôi thấy vô nghĩa, chả có gì đáng để nói ở cái ao làng này. Bây giờ sẽ đi vào những vấn đề cốt lõi.
Thứ nhất là con người. Tôi khẳng định rằng Việt Nam chúng ta có người giỏi để huấn luyện được mô hình LLMs. Ý tôi muốn nói ở đây là chưa cần phải kêu gọi các nhà khoa học người Việt có tên tuổi ở hải ngoại về nước, đội ngũ trong nước hoàn toàn có thể làm được.
Thứ hai là về fundings, là yếu tố quan trọng nhất. Nếu nói về đầu tư công thì AI chưa chắc đã phải là hạng mục ưu tiên trong bối cảnh nền kinh tế nước ta. Nếu có thì là tín hiệu tốt nhưng hiệu quả hay không thì chưa biết. Thực tế cho thấy khối tư nhân quản lý và vận hành đầu tư hiệu quả hơn. Còn nói về đầu tư tư nhân thì chưa có nguồn nào đáng kể. NVIDIA vào Việt Nam để thúc đẩy AI Factory, FPT đầu tư 200 triệu đô la vào dự án AI Factory nhưng số GPU ấy để kinh doanh cloud computing chứ ko phải chỉ để phục vụ nghiên cứu và phát triển AI. Các bạn biết còn doanh nghiệp nào của VN mua nhiều GPU của NVIDIA cho mục đích gì khác có thể để lại comments.
Như vậy có thể nói rằng chúng ta sẽ không nằm trong số các nước đua nhau phát triển LLMs được. Số các nước đó rất nhiều, các bạn cũng không cần phải lo lắng gì nhiều lắm. Bây giờ chúng ta sẽ cùng bàn về chiến lược chung dành cho những quốc gia này.
Thứ nhất: tận dụng mã nguồn mở. Mã nguồn mở là con đường tất yếu để thúc đẩy sự phát triển công nghệ. Như vậy có thể nói rằng chúng ta tiếp cận và làm chủ được công nghệ lõi - LLMs.
Thứ hai: đầu tư vào hạ tầng và sự toàn vẹn dữ liệu. Để đưa AI vào từng ngõ ngách trong cuộc sống vấn đề còn lại là dữ liệu. Sự toàn vẹn dữ liệu có nghĩa là dữ liệu người dùng phải được lưu trữ trên lãnh thổ nước sở tại, đối với bất kỳ 1 công ty, tổ chức nào hoạt động trên lãnh thổ. Cơ sở hạ tầng về dữ liệu tốt sẽ là bàn đạp để đưa AI vào cuộc sống.
Thứ 3: phát triển ứng dụng và sản phẩm AI dựa trên LLMs. LLMs nếu chỉ đứng riêng một mình như ChatGPT, Deepseek.com, Google Gemini, … thì chỉ là công cụ hỏi đáp thông thường, không có nhiều giá trị cho doanh nghiệp. Tích hợp LLMs vào phần mềm của doanh nghiệp mới mang lại giá trị thực sự. Đó là xu hướng tất yếu của tất cả các quốc gia trong công cuộc đổi mới sáng tạo bằng AI.
Đã có rất nhiều startups làm sản phẩm AI và thất bại hoặc chưa thành công. Điều tối quan trọng không phải có làm được sản phẩm hay không mà sản phẩm làm ra được thương mại hoá như thế nào? Tôi thấy doanh nghiệp lớn có hệ sinh thái business bền vững có lợi thế hơn cả. Sản phẩm AI được phát triển in-house sẽ có dữ liệu để phát triển, có khách hàng cả nội bộ và bên ngoài sử dụng tạo thành 1 feedback loop, có dòng tiền để tiếp tục phát triển. Đại bộ phận startups đều không có hoặc không partner để bám vào được 1 hệ sinh thái business bền vững nào để tồn tại và sống sót.
Đặc trưng văn hoá và chính trị giữa các quốc gia, vùng miền khác nhau nên cross sales sản phẩm AI không thẳng như ruột ngựa. Sẽ tốn khá nhiều công sức để customize sản phẩm AI dựa trên dữ liệu và quy trình nghiệp vụ. Vậy nên, ứng dụng và sản phẩm AI dựa trên công nghệ lõi LLMs vẫn phải do chúng ta tự phát triển là chủ đạo. Ngân hàng sẽ là những đơn vị tiên phong nâng cấp các sản phẩm tài chính của mình là một ví dụ điển hình.
Thứ 4 là nguồn nhân lực. Chúng ta đứng trước thách thức bị thay thế bởi AI. Mặc dù không nói trước được gì trong tương lai, nhưng cá nhân tôi nghĩ điều đó không xẩy ra ngay đâu, phải cỡ vài chục năm nữa.
Nguồn nhân lực ở đây chia ra làm hai bộ phận: nhóm phát triển AI và nhóm biết sử dụng thành thạo và phối hợp với AI trong công việc. Việc làm AI đang tăng trưởng chóng mặt với mức đãi ngộ cao. Các trường Đại học ở VN chưa đáp ứng được trong việc đào tạo và bám theo sự phát triển của AI thế giới. Các trường Đại học đã theo cơ chế tư chủ cần có biện pháp cải thiện. Giáo dục sớm AI ở bậc phổ thông cũng chưa hẳn đã là tốt. Nó là con dao hai lưỡi có thể làm nhụt tính sáng tạo của học sinh.
Nhóm thứ hai là nhóm nên được đặc biệt quan tâm, vì nó bao trùm đại bộ phận lực lượng lao động. Đã có những khách hàng Châu Âu hỏi tôi thuê lập trình viên biết sử dụng AI tools để viết code. Tương lai không xa đâu, chúng ta sẽ không còn thấy yêu cầu tuyển dụng lập trình viên thành thạo một vài ngôn ngữ lập trình nào đó. Mà thay vào đó là lập trình viên thông thạo AI tools để viết code. Nghề nào thì cũng vậy thôi.
Tuy nhiên có 1 ý mà tôi muốn nhấn mạnh ở đây là “phối hợp với AI để giải quyết công việc.” Con người vẫn phải là chủ thể. Câu chuyện có thật như thế này. 29/10/2018 chuyến bay của hãng Lion Air số hiệu 610 của Indonesia gặp nạn. Máy bay đạt độ cao sau khoảng 10 phút cất cánh. Máy bay ở chế độ lái tự động. Do bị lỗi cảm biến angle-of-attack nên hệ thống MCAS đã hiểu sai rằng mũi máy bay đang hướng lên trên. Nó tự động điều khiển mũi máy bay trúc xuống dưới. Điều đáng buồn là phi công không được đào tạo cẩn thận, dựa dẫm vào chế độ tự lái nên đã không biết cách vô hiệu hoá MCAS để dành việc kiểm soát máy bay lại. Chiếc máy bay đã đâm xuống biển Java vài phút sau đó.
Ngoài ra thì các yếu tố về an ninh mạng, đạo luật, đạo đức AI cũng không kém phần quan trọng, xin nhường lại cho các bạn bổ sung.
From : https://www.facebook.com/share/p/18bXi4U6PE/