Nghiên cứu AI tràn lan mất kiểm soát! Hội nghị học thuật quốc tế ICLR ra tay, chỉnh đốn các bài gửi chất lượng thấp

robot
Đang tạo bản tóm tắt

AI lạm dụng tràn lan trong giới học thuật, số lượng bài báo và chất lượng phản biện giảm sút nghiêm trọng, nội dung sai lệch thấm nhập vào hệ thống nghiên cứu, các hội nghị quốc tế khẩn cấp thắt chặt quy định, niềm tin vào học thuật đang đối mặt với thử thách sụp đổ.

Làn sóng AI phản tác dụng đối với ngành nghiên cứu, chất lượng bài báo khoa học đang đối mặt với nguy cơ sụp đổ

Trong bối cảnh công nghệ trí tuệ nhân tạo phát triển nhanh chóng trên toàn cầu, giới nghiên cứu AI đang rơi vào một cuộc khủng hoảng niềm tin chưa từng có. Trong vài năm qua, hệ thống phản biện của các hội nghị hàng đầu đã bị tràn ngập bởi các bài gửi chất lượng thấp. Các nhà khoa học phát hiện rằng, tỷ lệ đóng góp của con người trong nhiều bài báo và nội dung đánh giá đồng đẳng (Peer Review) đang giảm rõ rệt. Hiện tượng này gây ra những lo ngại không chỉ về phong cách viết mà còn về độ chính xác của nội dung. Khi độ chính xác trở thành nền tảng của nghiên cứu học thuật, các công cụ tự động tạo ra lỗi đã âm thầm thấm nhập vào thành quả nghiên cứu.

Các nhà nghiên cứu tại Đại học California, Berkeley (UC Berkeley), Inioluwa Deborah Raji chỉ ra rằng, giới học thuật nhiệt tình trong việc ứng dụng AI để cải tiến các ngành khác, nhưng nghịch lý thay, chính ngành này lại rơi vào hỗn loạn do sự lạm dụng rộng rãi AI.

Dữ liệu cho thấy, quy mô của cuộc khủng hoảng đã đạt mức cảnh báo. Theo báo cáo nghiên cứu của Đại học Stanford (Stanford University) công bố tháng 8 năm 2025, 22% các bài báo trong ngành khoa học máy tính cho thấy dấu hiệu sử dụng các mô hình ngôn ngữ lớn (LLM). Công ty phân tích văn bản mới nổi Pangram trong khảo sát tại Hội nghị Đặc trưng Học tập Quốc tế (ICLR) 2025 phát hiện rằng, khoảng 21% ý kiến phản biện hoàn toàn do AI tạo ra, hơn nữa hơn một nửa quá trình phản biện sử dụng chỉnh sửa hỗ trợ AI. Thậm chí, khoảng 9% các bài gửi có hơn một nửa nội dung do AI sản xuất.

Giáo sư danh dự tại Đại học bang Oregon (Oregon State University), Thomas G. Dietterich, nhận định rằng, lượng bài gửi trên nền tảng preprint mở arXiv cũng tăng mạnh, phần nào do các nhà nghiên cứu đổ xô vào, nhưng rõ ràng là do sự thúc đẩy của các công cụ AI.

Cơ chế phản biện như bị vô hiệu? Các hội nghị hàng đầu quốc tế ra tay chỉnh đốn

Đối mặt với làn sóng bài báo chất lượng thấp và phản biện tự động, giới học thuật đã đến điểm phải hành động. Tháng 11 năm 2024, các phản biện của ICLR phát hiện một bài báo nghi do AI tạo ra, với điểm số đứng trong top 17% tổng số bài gửi, gây ra những nghi vấn mạnh mẽ về hệ thống đánh giá hiện tại. Sau đó, tháng 1 năm 2025, công ty kiểm tra GPTZero phát hiện hơn 100 lỗi tự động trong 50 bài báo trình bày tại Hội nghị trí tuệ nhân tạo hàng đầu thế giới NeurIPS. Các lỗi này bao gồm các tài liệu tham khảo ảo và dữ liệu biểu đồ sai lệch, làm tổn hại nghiêm trọng tính chính xác của nghiên cứu.

Để đối phó với hiện tượng này, ICLR đã cập nhật quy định sử dụng: nếu bài báo không trung thực tiết lộ việc sử dụng rộng rãi các mô hình ngôn ngữ, sẽ bị từ chối; các phản biện tự động chất lượng thấp cũng sẽ đối mặt với việc bài của chính họ bị từ chối.

Giáo sư Hany Farid của UC Berkeley cảnh báo nghiêm trọng rằng, nếu giới khoa học tiếp tục công bố các bài báo sai lệch và chất lượng thấp, xã hội sẽ mất niềm tin cơ bản vào các nhà khoa học. Thực tế, tốc độ tăng số lượng bài báo đã vượt xa khả năng phát hiện công nghệ. Ví dụ, tại NeurIPS, năm 2020 có 9.467 bài gửi, đến năm 2024 tăng lên 17.491, và năm 2025 còn tăng vọt lên 21.575. Thậm chí xuất hiện các trường hợp cá nhân nộp hơn 100 bài trong một năm, rõ ràng đã vượt quá giới hạn sản xuất bình thường của con người. Hiện tại, giới học thuật vẫn thiếu tiêu chuẩn thống nhất về nhận diện tự động nội dung, khiến công tác phòng ngừa trở nên vô cùng khó khăn.

Nguồn hình ảnh: Giáo sư Hany Farid, Đại học California, Berkeley

Áp lực thương mại và ô nhiễm dữ liệu, cuộc chiến dài hạn của giới nghiên cứu

Phía sau cơn bùng nổ trong giới học thuật này là sự đan xen của cạnh tranh thương mại phức tạp và các yếu tố thực tế. Với mức lương cao và cạnh tranh công nghệ ngày càng gay gắt trong ngành AI, một số trọng tâm của ngành nghiên cứu buộc phải chuyển sang sản xuất số lượng hơn là chất lượng. Sự thổi phồng quá mức của thị trường đã thu hút nhiều người ngoài ngành mong muốn đạt thành tích nhanh, từ đó làm giảm chiều sâu của nghiên cứu học thuật. Tuy nhiên, các chuyên gia cũng nhấn mạnh cần phân biệt giữa “sử dụng hợp lý” và “lạm dụng”.

Thomas G. Dietterich đề cập rằng, đối với các nhà nghiên cứu không nói tiếng Anh như các học giả đến từ Trung Quốc, công cụ AI thực sự giúp nâng cao rõ ràng trong biểu đạt ngôn ngữ, việc hỗ trợ viết này phần nào cải thiện hiệu quả giao tiếp của bài báo, nên được xem là tích cực.

Tuy nhiên, cuộc khủng hoảng sâu xa hơn nằm ở “ô nhiễm dữ liệu” đe dọa sự phát triển của AI trong tương lai. Các tập đoàn công nghệ lớn như Google, Anthropic và OpenAI đang thúc đẩy việc sử dụng các mô hình như đối tác nghiên cứu trong các ngành khoa học đời sống, và chính các mô hình này lại dựa vào các văn bản học thuật để huấn luyện.

Hany Farid chỉ ra rằng, nếu dữ liệu huấn luyện tràn ngập nội dung tổng hợp nhân tạo quá nhiều, hiệu suất của mô hình sẽ giảm sút đáng kể.

Các nghiên cứu trước đây đã chứng minh rằng, khi LLM được cung cấp dữ liệu tự động chưa qua chọn lọc, cuối cùng mô hình sẽ sụp đổ và sinh ra thông tin vô nghĩa. Giám đốc bộ phận khoa học của OpenAI, Kevin Weil, thừa nhận rằng, mặc dù AI có thể trở thành công cụ tăng tốc nghiên cứu mạnh mẽ, nhưng sự giám sát và kiểm tra của con người là không thể thiếu, vì công nghệ không thể thay thế thái độ cẩn trọng trong quá trình nghiên cứu.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim