Khả năng suy luận đạo đức của OpenAI GPT-4 phát triển vượt trội hơn so với các chuyên gia con người.

VNZ-NEWS
Vn-Z.vn Ngày 24 tháng 06 năm 2024, Một nghiên cứu gần đây chỉ ra rằng chatbot mới nhất của OpenAI, GPT-4o, có khả năng cung cấp các giải thích và lời khuyên về đạo đức với chất lượng vượt trội hơn so với các chuyên gia đạo đức "được công nhận".

Các nhà nghiên cứu từ Đại học North Carolina tại Chapel Hill và Viện nghiên cứu AI Allen đã thực hiện hai nghiên cứu để so sánh khả năng suy luận đạo đức của mô hình GPT với con người, nhằm tìm hiểu xem liệu các mô hình ngôn ngữ lớn có thể được xem là "chuyên gia đạo đức" hay không.

Dưới đây là tóm tắt nội dung nghiên cứu được công bố trên tạp chí khoa học.

Nghiên cứu 1

501 người trưởng thành ở Mỹ đã so sánh các giải thích về đạo đức của mô hình GPT-3.5-turbo với những người tham gia là con người khác. Kết quả cho thấy mọi người đánh giá các giải thích của GPT là đạo đức hơn, đáng tin cậy hơn và chu đáo hơn so với các giải thích của con người.

Các đánh giá viên cũng cho rằng đánh giá của AI đáng tin cậy hơn so với con người khác. Mặc dù sự khác biệt là nhỏ, nhưng phát hiện chính là AI có thể đạt hoặc thậm chí vượt qua mức độ suy luận đạo đức của con người.

ChatGPT4-o.webp


Nghiên cứu 2​

Nghiên cứu này so sánh các gợi ý do mô hình GPT-4o mới nhất của OpenAI tạo ra với các gợi ý của nhà đạo đức học nổi tiếng Kwame Anthony Appiah trong chuyên mục "The Ethicist" của tờ New York Times. 900 người tham gia đã đánh giá chất lượng gợi ý cho 50 "tình huống đạo đức".

Kết quả cho thấy GPT-4o vượt trội hơn các chuyên gia con người trong "hầu như mọi khía cạnh". Người tham gia cho rằng các gợi ý do AI tạo ra đúng đắn hơn về mặt đạo đức, đáng tin cậy hơn, chu đáo hơn và chính xác hơn. Chỉ trong việc nhận thức những sắc thái tinh tế, không có sự khác biệt đáng kể giữa AI và chuyên gia con người.

ChatGPT4-o-dao-duc.webp


Các nhà nghiên cứu cho rằng những kết quả này cho thấy AI có thể vượt qua "bài kiểm tra đạo đức Turing so sánh" (cMTT). Phân tích văn bản cho thấy GPT-4o sử dụng ngôn ngữ đạo đức và tích cực nhiều hơn so với các chuyên gia con người khi đưa ra lời khuyên. Điều này có thể phần nào giải thích tại sao các gợi ý của AI được đánh giá cao hơn, nhưng không phải là yếu tố duy nhất.

Cần lưu ý rằng nghiên cứu này chỉ được tiến hành với những người tham gia từ Mỹ, do đó cần nghiên cứu thêm để hiểu rõ hơn về sự khác biệt văn hóa trong cách mọi người đánh giá suy luận đạo đức do AI tạo ra.
 
Trả lời

mrJaden

Rìu Bạc Đôi
Im coming, immmm comingggg sun {beauty}
 

keanbamvidai

Gà con
cái kết của loài người sắp thành hiện thực lại sắp giống bộ viễn tưởng ngày phán quyết loài ng chống lại rô bốt