Google DeepMind Imagen 3: Mô hình văn bản thành hình ảnh chất lượng cao nhất của Google | VN-Zoom | Cộng đồng Chia Sẻ Kiến Thức Công Nghệ và Phần Mềm Máy Tính

Adblocker detected! Please consider reading this notice.

We've detected that you are using AdBlock Plus or some other adblocking software which is preventing the page from fully loading.

We don't have any banner, Flash, animation, obnoxious sound, or popup ad. We do not implement these annoying types of ads!

We need money to operate the site, and almost all of it comes from our online advertising.

Please add https://vn-z.vn to your ad blocking whitelist or disable your adblocking software.

×

Google DeepMind Imagen 3: Mô hình văn bản thành hình ảnh chất lượng cao nhất của Google

Whale

Rìu Chiến
aI0qlAV.gif
PHP:
https://gemini.google.com/

Google gần đây đã triển khai mô hình Imagen 3 cho tất cả người dùng Gemini trên toàn thế giới.
  • Với tính khả dụng này, cả người dùng Gemini và Gemini Advanced đều có thể chỉ cần mô tả hình ảnh họ muốn tạo và Gemini sẽ phản hồi bằng hình ảnh do AI tạo ra.
  • Tuy nhiên, chỉ người dùng Gemini Advanced mới có thể tạo hình ảnh có người.
02.jpg

Chi tiết hơn​

Chúng tôi đã cải thiện đáng kể khả năng hiểu lời nhắc của Imagen 3, giúp các mô hình tạo ra nhiều kiểu hình ảnh khác nhau và nắm bắt các chi tiết nhỏ từ lời nhắc dài hơn.
  • Tính linh hoạt cao hơn và hiểu biết nhanh chóng
  • Hình ảnh chất lượng cao hơn
  • Hiển thị văn bản tốt hơn

Từ những bức vẽ nguệch ngoạc đến kiệt tác​

03.jpg
Chúng tôi thiết kế Imagen 3 để tạo ra những hình ảnh chất lượng cao ở nhiều định dạng và phong cách khác nhau, từ phong cảnh chân thực đến tranh sơn dầu có kết cấu phong phú hay cảnh đất sét kỳ ảo.

2W_NA8iC6SExw_ZFJITkuFsUkhrBVsv1se6ucklv42bUN8VeDqaB9hnNr-0jDu4YGX8kOH7Pgt36tf4UKeCFmGxRR5s_rHfnvWgtl0zotL1XP2WR=h600-rw
Chụp theo phong cách máy ảnh DSLR với bộ lọc phân cực. Ảnh chụp hai khinh khí cầu đang lơ lửng trên các khối đá độc đáo ở Cappadocia, Thổ Nhĩ Kỳ. Màu sắc và hoa văn trên những khinh khí cầu này tương phản đẹp mắt với tông màu đất của cảnh quan bên dưới. Bức ảnh này ghi lại cảm giác phiêu lưu khi tận hưởng trải nghiệm như vậy.

lT9-yJuCXvk2aZlgFnsEBXXd2Ws7hy3BCk1tFX5dUSAS9BfatxVifE6VqakU7brGmuBe0ZhTVnnrZ8h89JTWsDwpZkYzLWjTfDRReRjydtbYnoSrxAQ=h600-rw
Một con robot gỗ cũ kỹ, phủ đầy dây leo nở hoa đứng yên bình trên một cánh đồng hoa dại cao, với một chú chim xanh nhỏ đang nghỉ ngơi trên bàn tay dang rộng của nó. Phim hoạt hình kỹ thuật số, với màu sắc ấm áp và đường nét mềm mại. Một vách đá lớn với thác nước hiện ra phía sau.

fCjHz9zkAwmnCBGsGaz5gAz-JjYZsN_Wb7n9StRuef6AMsy2QurpUzBaUjXo1OVxM2Oaa6pG_p1zf7OjyrTUU5nhMNT_iYtsqtmdB0vjNiTT1vSX=h600-rw
Ảnh chân dung một con rồng ngoài đời thực đang nghỉ ngơi thanh thản trong sở thú, cuộn tròn bên cạnh chú cừu cưng. Ảnh tĩnh điện ảnh, ảnh DSLR chất lượng cao.

Tính linh hoạt cao hơn và hiểu biết nhanh chóng​

Imagen 3 hiểu được các lời nhắc được viết bằng ngôn ngữ tự nhiên, hàng ngày, giúp bạn dễ dàng có được kết quả mong muốn mà không cần kỹ thuật tạo lời nhắc phức tạp.

BwWGmk21tm-ED6ALN-5MKULJ96T-9UlLwxOtToqmnyZ-56iHG7KoyBSQImaEqc00tbugmOO-W16r96jFIQNMtqHijR_4qa43hADGm7yJmovAR0D3nA=w1920-rw

Được đào tạo về chi tiết, cung cấp độ chính xác​

Để giúp Imagen 3 nắm bắt được các sắc thái như góc máy ảnh cụ thể hoặc bố cục trong các lời nhắc dài và phức tạp, chúng tôi đã thêm chi tiết phong phú hơn vào chú thích của mỗi hình ảnh trong dữ liệu đào tạo của nó. Với thông tin tốt hơn để học hỏi, Imagen 3 tạo ra nhiều chủ đề và phong cách chính xác hơn.

QeamcO0OtgI2aIS5Aj_8lp-H7FIzh1pIm_XxGsmIJzvUg6kuCSsVCvbXpRLefSmTBjGYhxYXvw2vk9JbGmN5EOQhLx6I77TZar-mTD2FA7yqyr0Czw=h600-rw
Một bó hoa lớn, nhiều màu sắc trong một chiếc bình thủy tinh xanh cũ trên bàn. Phía trước là một bông hoa mẫu đơn tuyệt đẹp được bao quanh bởi nhiều loại hoa khác như hoa hồng, hoa loa kèn, hoa cúc, hoa lan, trái cây, quả mọng, lá xanh. Nền màu xám đậm. Tranh sơn dầu theo phong cách Thời kỳ hoàng kim của Hà Lan.

uvctDcK_sWVmKK5PhDruRwoAdrA1eH6Xh7EeTLr1UUnjO9gAuQ5XMkaD6NytKubXG5d3Chl6YAzX-eLQa9OWkcwkJnMpb-4udxrjcnOxohHvi58qig=h600-rw
Hình ảnh bàn tay của một người đang cầm một nhánh bạch đàn - một bức ảnh DSLR cận cảnh làm nổi bật sự cân bằng giữa con người và thiên nhiên.

Hình ảnh chất lượng cao hơn​

Imagen 3 tạo ra hình ảnh chất lượng cao, phong phú về mặt thị giác, với ánh sáng và bố cục tốt. Nó có thể hiển thị chính xác các chi tiết nhỏ như nếp nhăn nhỏ trên bàn tay của một người và các kết cấu phức tạp như một con voi nhồi bông đan.

hOiSVlpbDc8uKDXZMb3AOQX9GBn1NQbd0H0j4yo4CmpqzDxQbL8x42scp56ze5TTn-UCb6LdtOEYnhxU6Ilg0w8k-VNHJ3mObrv2_bf6N7aMvWtRpQ=h600-rw
Voi amigurumi đi bộ trên thảo nguyên, một bức ảnh chuyên nghiệp, nền mờ

ezm5GWso2aqKJhQ-KI-Gj7El2uvJJcr-cDXvJp3PC8IYsH6NPxzYwBNsWBsQERFkg7xFB8JbzP30l_p4uGfv4yCcWWpvROdwPg_wclApFxbDWB80Ng=h600-rw
Một góc nhìn về bàn tay của một người khi họ cầm một bức tượng nhỏ bằng đất sét hình con chim trên tay và nặn nó bằng một công cụ tạo hình ở tay kia. Bạn có thể thấy chiếc khăn của nhà điêu khắc. Bàn tay của họ phủ đầy bụi đất sét. Một bức ảnh DSLR cận cảnh làm nổi bật kết cấu và sự khéo léo.

6GHu-bM9a_asfdKQNde32N2epqb9Vrjf7Y9SNRMWxWMQPRWLuTQwq5kkwtZJa805wrvWPrTqJQ-4HucX4NZlaRDoU5eGDLKxEHhjpDkPxMJtvXKsFQ=h600-rw
Đồ chơi gấu bông màu trắng đang ngủ trong phòng trẻ em, trên sàn phòng ngủ của trẻ sơ sinh với các hộp đồ chơi và đồ chơi xung quanh, theo phong cách dựng hình 3D chân thực

Hiển thị văn bản tốt hơn​

Chúng tôi đã cải thiện đáng kể khả năng hiển thị văn bản, mở ra nhiều khả năng mới cho các trường hợp sử dụng như thiệp sinh nhật cách điệu, bài thuyết trình, v.v.

04.jpg

An toàn từ phát triển đến triển khai​

Chúng tôi đã sử dụng bộ lọc mở rộng và dán nhãn dữ liệu để giảm thiểu nội dung có hại trong các tập dữ liệu và giảm khả năng xuất hiện các đầu ra có hại. Chúng tôi cũng tiến hành nhóm đỏ và đánh giá về các chủ đề bao gồm tính công bằng, thiên vị và an toàn nội dung.
Chúng tôi đang triển khai Imagen 3 với các công nghệ bảo mật, an toàn và riêng tư mới nhất, bao gồm công cụ tạo hình mờ SynthID cải tiến — công cụ này nhúng hình mờ kỹ thuật số trực tiếp vào các điểm ảnh của hình ảnh, giúp nhận dạng được nhưng mắt người lại không thể nhận ra.


Hãy chia sẻ trải nghiệm của bạn về Imagen 3 cho chúng tôi !
 
Đang tính nhờ Gemini làm một bản deepmind chất lượng cao cảnh Sài gòn chiều mưa ngập nước kẹt xe xem như nào...
 

Swings Onlyone

Rìu Chiến
VIP User
thằng gemini này còn mang bệnh phân biệt chủng tộc, văn hoá, tôn giáo trong người không?
bệnh này giờ ngta gọi là woke mental ill
 


Top