Giveaway  Miễn phí trọn đời bản quyền PDF Text OCR Xtractor, Trích xuất văn bản từ các tệp PDF và tất cả các định dạng hình ảnh phổ biến.

VNZ-NEWS
Vn-z.vn Ngày 05 tháng 09 năm 2024, PDF Text OCR Xtractor, một công cụ hoàn hảo để trích xuất văn bản từ các tệp PDF và nhiều định dạng hình ảnh phổ biến như PNG, JPG, BMP và TIFF.

ss001.png

Phần mềm này sử dụng công nghệ Tesseract OCR, một trong những phần mềm nhận dạng ký tự quang học (OCR) mạnh mẽ và tiên tiến nhất. Tesseract được phát triển bởi HP vào năm 1994, sau đó được phát hành dưới giấy phép Apache cho các nhà phát triển mã nguồn mở. Năm 2006, Google tiếp quản dự án và tài trợ cho các nhà phát triển, biến Tesseract trở thành công cụ OCR mạnh mẽ nhất hiện nay, sử dụng công nghệ học sâu (Deep Learning) để trích xuất văn bản từ hình ảnh và PDF.

PDF Text OCR Xtractor hỗ trợ hơn 20 ngôn ngữ khác nhau và cho phép tùy chỉnh các tham số xử lý hình ảnh như làm mịn, điều chỉnh DPI, tăng độ tương phản và các thủ thuật hữu ích khác trước khi phân tích.

Một số tính năng chính của phần mềm:

1. Sử dụng công nghệ OCR tốt nhất hiện có.
2. Hỗ trợ hơn 20 ngôn ngữ.
3. Cung cấp các công cụ chỉnh sửa hình ảnh để tăng độ chính xác cho các tài liệu khó xử lý.

Tính năng bổ sung:

1. Giao diện đồ họa rẻ nhất cho công cụ Tesseract.
2. Hỗ trợ PDF và tất cả các định dạng hình ảnh phổ biến như PNG, JPG, BMP.

PDF Text OCR Xtractor thường được nhà phát triển bán với giá hơn 29 USD. Hiện tại bạn có thể nhận bản quyền trọn đời miễn phí. Để nhận bản quyền các bạn làm theo các bước sau.

- Tải về phiên bản PDF Text OCR Xtractor giveaway tại đây
View hidden content is available for registered users!

- Cài đặt . Phần mềm đã được kích hoạt sẵn.
 
Trả lời

dauchuavn

Gà con
Cảm ơn ad rất nhiêu. mong nhận thêm nhiều phần mềm hữu ích nữa.
 

ngaithon

Gà con
window hả bác, có mac os không bác ơi
 

mamnen113

Búa Gỗ Đôi
Nếu bạn nào dùng để lọc tiếng anh thì khá là phù hợp nhưng tiếng việt thì mình dùng khá nhiều rồi soft nào cũng lỗi, không lỗi ít thì lỗi nhiều. Mà bữa này google có thể làm được rồi đó. PDF thì mình không rõ lắm, nhưng bạn chuyển đổi nó qua file hình ảnh lên google là có thể copy ra văn bản được rồi. trừ có bảng, tranh vẽ, biểu đồ là không chuyển đổi được thôi.
 

trinhh

Búa Gỗ
Nếu văn bản chỉ gồm text thì dễ rồi, khó vẫn là có hình, bảng biểu, khó nhất có lẽ là công thức toán học, vật lý, hóa học.
 

bbkim

Mỗi người một câu chuyện
Tổng quát thì mình vẫn tin dùng abbyy hơn mấy cái này. Việt nam cũng có phần mềm gì đó nhận diện khá ổn nhưng không giữ được format, không chuyển được bảng biểu và trích xuất hình ảnh,... ta lại về với abbyy vậy.
 

ThienPhong

Gà con
Không bằng Abbyy thì thôi, ta vẫn quay lại với Abbyy.
Chứ nếu text bình thường thì Acrobat DC vẫn chuyển sang ngon lành.
Có anh GG Text cũng được, cơ mà bản miễn phí thì không giữ được định dạng.
 

thanit9x

Búa Đá
Mình mới test thử thì phần mềm nhận diện tiếng việt kém, lỗi font chữ khá nhiều. Khi cài đặt sẽ đi kèm các phần mềm phụ không cần thiết.
Chuẩn, gỡ phát mệt ạ :D
Nếu bạn nào dùng để lọc tiếng anh thì khá là phù hợp nhưng tiếng việt thì mình dùng khá nhiều rồi soft nào cũng lỗi, không lỗi ít thì lỗi nhiều. Mà bữa này google có thể làm được rồi đó. PDF thì mình không rõ lắm, nhưng bạn chuyển đổi nó qua file hình ảnh lên google là có thể copy ra văn bản được rồi. trừ có bảng, tranh vẽ, biểu đồ là không chuyển đổi được thôi.
Chuẩn luôn, hiện chưa hỗ trợ unicode :D
 

ohmygodness

Rìu Sắt
mấy phần mềm OCR từ lúc google docs chuyển được là coi như phế hoàn toàn rồi
chờ ngày abbyy lên đĩa nốt với mấy công cụ AI ngày càng mạnh