Doanh nghiệp mở dữ liệu thực cho cộng đồng giải bài toán lớn về AI Lần đầu tiên một doanh nghiệp đưa ra dữ liệu thật của mình, đưa ra những bài toán thực của nhu cầu kinh doanh và cam kết về đầu tư hạ tầng lớn cho các thí sinh tham gia giải các bài toán lớn về AI… Tại buổi phát động cuộc thi Viettel AI Race 2026, sân chơi công nghệ dành cho cộng đồng đam mê trí tuệ nhân tạo (AI) chiều 2/7 do Tập đoàn Công nghiệp - Viễn thông quân đội (Viettel) tổ chức, bà Vũ Thị Mai, Trưởng ban Tổ chức nhân lực tập đoàn Viettel, cho biết AI chỉ thực sự tạo ra giá trị khi được đặt trong những bài toán thực tế, dữ liệu thực tế và yêu cầu vận hành thực tế.
“Với Viettel AI Race 2026, lần đầu tiên một doanh nghiệp đưa ra dữ liệu thật của mình, đưa ra những bài toán thực của nhu cầu kinh doanh và đặc biệt cam kết về đầu tư hạ tầng rất lớn để thí sinh giải các bài toán về AI ”, bà Mai nhấn mạnh.
Thông tin chính
Mục tiêu lớn nhất của cuộc thi là kết nối và xây dựng cộng đồng về nhân tài AI, nơi mà mọi người được chia sẻ với bài toán thực, dữ liệu thực từ doanh nghiệp và hạ tầng đủ lớn, đây là các yếu tố quan trọng trong việc hình thành lên các mô hình AI. Trong khi với các dữ liệu mô phỏng hay bài toán giả định sẽ có những hạn chế nhất định đối với những ý tưởng hay AI model. Liên quan đến việc Viettel mở dữ liệu cho cộng đồng tham gia cuộc thi Viettel AI Race 2026, ông Bùi Trường Vinh, Phó Trưởng ban Ban Công nghệ thông tin Tập đoàn Viettel, cho biết Viettel cũng đã tính toán mở dữ liệu như thế nào để vừa đáp ứng được cho các thí sinh vừa đáp ứng được các luật và nghị định về AI, hay Luật Dữ liệu, Luật An ninh mạng...
Trong đó có những điểm nhạy cảm như dữ liệu cá nhân thì không được tiếp cận – đây cũng là thách thức của ban tổ chức. Theo ông Vinh, năm nay bắt buộc phải sử dụng dữ liệu thật và áp dụng các kỹ thuật liên quan tới khử nhận dạng, ẩn danh để đảm bảo quy định của pháp luật. Và đội ngũ kỹ thuật của Viettel đã hoàn thiện giải pháp kỹ thuật liên quan đến khử nhận dạng và các dữ liệu này đưa ra vừa đảm bảo không vi phạm pháp luật, vừa đảm bảo việc người thi được tiếp cận dữ liệu của doanh nghiệp mà bên ngoài không có.
Điểm đáng chú ý
- Mục tiêu lớn nhất của cuộc thi là kết nối và xây dựng cộng đồng về nhân tài AI, nơi mà mọi người được chia sẻ với bài toán thực, dữ liệu thực từ doanh nghiệp và hạ tầng đủ lớn, đây là các yếu tố quan trọng trong việc hình thành lên các mô hình AI.
- Trong khi với các dữ liệu mô phỏng hay bài toán giả định sẽ có những hạn chế nhất định đối với những ý tưởng hay AI model.
- Liên quan đến việc Viettel mở dữ liệu cho cộng đồng tham gia cuộc thi Viettel AI Race 2026, ông Bùi Trường Vinh, Phó Trưởng ban Ban Công nghệ thông tin Tập đoàn Viettel, cho biết Viettel cũng đã tính toán mở dữ liệu như thế nào để vừa đáp ứng được cho các thí sinh vừa đáp ứng được các luật và nghị định về AI, hay Luật Dữ liệu, Luật An ninh mạng...
- Trong đó có những điểm nhạy cảm như dữ liệu cá nhân thì không được tiếp cận – đây cũng là thách thức của ban tổ chức.
Bối cảnh
Đồng thời hạ tầng triển khai cho cuộc thi do Viettel làm chủ do vậy đảm bảo tính an toàn bảo mật cao. Có hai loại dữ liệu được xem là quan trọng (key), theo ông Vinh, đó là dữ liệu liên quan đến hạ tầng mạng lưới BTS của Viettel – là những dữ liệu duy nhất Viettel có và những dữ liệu đó trong quá trình Viettel vận hành, quản lý mạng lưới đã được thu thập và làm giàu dữ liệu trên toàn quốc. Dữ liệu quan trọng thứ hai là là tập dữ liệu liên quan đến tri thức, y tế.
Đề thi LLM Inference Optimization tập trung vào tối ưu vận hành mô hình ngôn ngữ lớn, một trong những thách thức quan trọng khi đưa AI tạo sinh vào thực tiễn. Đề thi Ontological Reasoning in Medical Knowledge Retrieval hướng tới truy xuất và suy luận tri thức y tế, thuộc lĩnh vực Xử lý ngôn ngữ tự nhiên. Hội đồng chuyên môn Viettel AI Race 2026 do các chuyên gia Viettel chủ trì, với sự tham gia tư vấn của các phó giáo sư, tiến sĩ giàu kinh nghiệm trong lĩnh vực trí tuệ nhân tạo và khoa học máy tính đến từ các trường đại học, học viện hàng đầu Việt Nam, cùng các đối tác trong và ngoài nước.
Theo VnEconomy Kinh tế số