Chuyên gia nghiên cứu dùng GPT-4V để chơi game "Doom"

VNZ-NEWS
Vn-Z.vn Ngày 13 tháng 03 năm 2024, Gần đây , nhà nghiên cứu từ Đại học York, Anh, Adrian de Wynter, đã công bố một bài báo nghiên cứu có tựa đề "Will GPT-4 Run DOOM?", thảo luận về cách sử dụng mô hình GPT-4V để chơi trò chơi "Doom".

GPT4V-Doom.webp

De Wynter đã thiết kế một hệ thống để sử dụng mô hình GPT-4V (phiên bản phát sinh đa modal của GPT-4, có thể nhận hình ảnh làm đầu vào) có thể chụp ảnh màn hình từ động cơ trò chơi và trả lại mô tả cấu trúc của trạng thái trò chơi.

Anh đã thiết kế một mô hình Agent, dựa trên thông tin đầu vào về thị giác, và so sánh với lịch sử trước đó để ra quyết định, sau đó chuyển đổi phản ứng của mình thành các lệnh bấm phím mà trò chơi "Doom" có thể hiểu được.

GPT4V-Doom-2.webp

Nói một cách đơn giản, hệ thống sẽ chụp ảnh chụp màn hình của trò chơi và sử dụng những ảnh này để xác định những điều đang diễn ra trong trò chơi. Sau đó, sử dụng một phần khác của hệ thống, mô hình đại diện, đưa ra quyết định bước tiếp theo của trò chơi. Mô hình đại diện chuyển đổi quyết định của mình thành các lệnh mà trò chơi có thể hiểu, như bấm phím nào.

Theo kết quả kiểm tra, hiện tại GPT-4V khi chạy trò chơi "Doom" vẫn còn một số vấn đề:

- GPT-4 thiếu tính chất vĩnh viễn của đối tượng, điều này có nghĩa là kẻ thù trong trò chơi không xuất hiện trên màn hình và quên chúng.

- GPT-4 gặp khó khăn trong việc suy luận và giải thích rõ ràng hành vi của mình, thường cung cấp thông tin sai lầm.

Bất chấp những hạn chế này, de Wynter cho rằng điều đáng chú ý là GPT4 có thể chơi DOOM mà không cần đào tạo trước.

Bạn có thể đọc chi tiết bài báo tại đây