OpenAI phát hành mẫu AI sáng tạo hàng đầu mới GPT-4o: trò chuyện bằng giọng nói mượt mà hơn và miễn phí

Santoso
1715621462_gpt-4of1f3aad73a6fbe77.jpeg


Trong sự kiện phát trực tuyến Bản cập nhật mùa xuân của OpenAI , công ty khởi nghiệp AI đã công bố mô hình ngôn ngữ lớn (LLM) tiếp theo mà công ty gọi là ChatGPT-4o.

Trong buổi thuyết trình, giám đốc công nghệ của OpenAI, Mira Murati, đã tuyên bố rằng công ty muốn mở rộng phạm vi hoạt động của ChatGPT-4 LLM. Việc phát hành ChatGPT-4o sẽ cho phép điều đó xảy ra bằng cách cung cấp cho tất cả mọi người, ngay cả người dùng miễn phí. Điều này đã được Giám đốc điều hành OpenAI Sam Altman xác nhận trong một bài đăng trên X (trước đây là Twitter) :



Trong buổi demo trực tiếp, các thành viên nhóm OpenAI đã trò chuyện với ChatGPT-4o bằng lệnh thoại tự nhiên. Giọng nói AI có thể thay đổi ngữ điệu chỉ bằng một số gợi ý giọng nói từ con người trên sân khấu, bao gồm thay đổi âm sắc để giọng nói ấn tượng hơn hoặc thậm chí chuyển sang giọng giống robot.

Trong một bản demo khác, ChatGPT-4o được hiển thị một phương trình toán học được viết thông qua camera của điện thoại thông minh và giọng nói AI có thể mô tả phương trình đó và hơn thế nữa. Altman đã đăng trên tài khoản X của mình rằng ChatGPT-4o sẽ bắt đầu được triển khai trong vài tuần tới.

Trong một bài đăng trên blog OpenAI , có thêm thông tin về những gì đi kèm với mẫu ChatGPT-4o mới:

Nó có thể phản hồi với đầu vào âm thanh chỉ trong 232 mili giây, trung bình là 320 mili giây, tương tự như thời gian phản hồi của con người(opens in a new window) trong một cuộc trò chuyện. Nó phù hợp với hiệu suất của GPT-4 Turbo trên văn bản bằng tiếng Anh và mã, với sự cải thiện đáng kể về văn bản ở các ngôn ngữ không phải tiếng Anh, đồng thời nhanh hơn nhiều và rẻ hơn 50% trong API. GPT-4o đặc biệt tốt hơn về khả năng hiểu hình ảnh và âm thanh so với các mẫu hiện có.

Microsoft là nhà đầu tư công nghệ lớn và là đối tác của OpenAI và thường xuyên bổ sung các mô hình mới của OpenAI vào các dịch vụ AI của riêng mình. Tại thời điểm viết bài này, vẫn chưa có thông tin về thời điểm ChatGPT-4o sẽ được thêm vào các sản phẩm AI của Microsoft.

OpenAI cũng tiết lộ rằng GPT Store, nơi mọi người có thể cung cấp các chatbot tùy chỉnh cho các tác vụ cụ thể, hiện có sẵn cho mọi người dùng ChatGPT truy cập.
 
Trả lời

VNZ-NEWS

Administrator
Thành viên BQT
Vn-Z.vn Ngày 14 tháng 05 năm 2024, Mới đây , OpenAI đã công bố ra mắt mẫu AI thế hệ mới nhất GPT-4o, mẫu AI này sẽ được tích hợp vào nhiều sản phẩm OpenAI khác nhau theo từng giai đoạn trong vài tuần tới. Điều đặc biệt nhất là GPT-4o sẽ được cung cấp miễn phí cho tất cả người dùng.

GPT-4o.webp

Giám đốc công nghệ OpenAI Muri Murati cho biết GPT-4o sẽ có mức độ thông minh tương tự như GPT-4, nhưng được cải tiến nhiều hơn về xử lý văn bản, hình ảnh và giọng nói.

“GPT-4o có thể tận dụng sự kết hợp giữa thông tin lời nói, văn bản và hình ảnh để suy luận,” Murati nói trong bài phát biểu quan trọng tại trụ sở công ty OpenAI.

GPT-4 là mẫu chatbot AI hàng đầu trước đây của OpenAI, có thể xử lý thông tin trộn lẫn với hình ảnh và văn bản, đồng thời có thể hoàn thành các tác vụ như trích xuất văn bản từ hình ảnh hoặc mô tả nội dung hình ảnh. Còn GPT-4o được bổ sung thêm khả năng xử lý giọng nói dựa trên GPT-4.

Tốc độ chạy của GPT-4o sẽ được cải thiện đáng kể , điểm nổi bật lớn nhất là công nghệ mới được sử dụng trong chế độ tương tác giọng nói. OpenAI đã cam kết cho phép người dùng giao tiếp với ChatGPT thông qua giọng nói, như thể họ đang nói chuyện với người thật. Tuy nhiên, các phiên bản trước có vấn đề về độ trễ ảnh hưởng nghiêm trọng đến sự hấp dẫn của cuộc đối thoại. GPT-4o sử dụng công nghệ hoàn toàn mới để cải thiện đáng kể tốc độ phản hồi của các cuộc hội thoại chatbot.

Sh80Er3.png

Tại buổi họp báo , OpenAI đã trình diễn cách sử dụng GPT-4o có thể đối thoại bằng giọng nói. Sau khi người thuyết trình đặt câu hỏi, GPT-4o sẽ phản hồi gần như ngay lập tức và đọc to câu hỏi đó thông qua tính năng chuyển văn bản thành giọng nói, khiến cuộc trò chuyện trở nên tự nhiên và thực tế hơn.

Một minh chứng khác cho thấy GPT-4o có thể điều chỉnh âm sắc của giọng nói theo hướng dẫn, từ kịch tính cường điệu đến máy móc lạnh lùng, thể hiện độ dẻo tuyệt vời, bản demo cũng thể hiện khả năng ca hát của GPT-4o.

Trước đây, khi OpenAI phát hành phiên bản mới của mô hình ChatGPT, hãng này thường áp đặt một mức phí. Tuy nhiên, lần này GPT-4o sẽ được cung cấp miễn phí cho tất cả người dùng, còn người dùng trả phí có thể tận hưởng gấp 5 lần giới hạn cuộc gọi.

qISYx0t.png

Ngoài ra, OpenAI đã phát hành phiên bản ChatGPT dành cho máy tính để bàn với giao diện người dùng mới. Mulati cho biết: “Chúng tôi nhận thấy rằng các mô hình này ngày càng trở nên phức tạp hơn, nhưng chúng tôi muốn trải nghiệm của người dùng khi tương tác với mô hình AI trở nên tự nhiên và dễ dàng hơn để người dùng có thể hoàn toàn tập trung vào việc tương tác với mô hình AI.”

Các bạn có thể thử ChatGPT-4o tại đây
 

mrJaden

Rìu Bạc
Ủa vậy là mode 4o k default trên app mà phải dùg qua link trên của mod cho free users à?