LibreOffice tiếp tục chỉ trích Microsoft Office: Cố tình dựng rào cản để “trói” người dùng
Tổ chức Tài liệu (The Document Foundation – TDF), đơn vị đứng sau bộ ứng dụng văn phòng mã nguồn mở LibreOffice, đã đăng tải một bài blog mới, tiếp tục chỉ trích Microsoft, cáo buộc hãng này đặt lợi ích thương mại lên trên các tiêu chuẩn kỹ thuật, cố tình tạo ra những rào cản phức tạp để giữ chặt người dùng trong hệ sinh thái của mình thông qua định dạng tài liệu OOXML.
Thành viên sáng lập TDF, ông Italo Vignoli, lên án gay gắt việc Microsoft để “lợi ích kinh doanh” lấn át tất cả, bằng cách xây dựng định dạng tệp OOXML cực kỳ phức tạp, chủ động tạo ra các trở ngại về khả năng tương thích, từ đó khóa người dùng vào hệ sinh thái Office. Ông nhấn mạnh rằng việc ép buộc toàn ngành phải chấp nhận OOXML – một “tiêu chuẩn giả” – là hành vi “khó chấp nhận”.
Để minh chứng cho sự coi thường tiêu chuẩn của Microsoft, ông Vignoli dẫn lại một ví dụ nổi tiếng trong giới khoa học: lỗi Excel xử lý sai tên gen. Trong nghiên cứu di truyền học, các nhà khoa học thường dùng ký hiệu chữ – số để đặt tên gen, chẳng hạn như “MARCH1” (Membrane Associated Ring-CH-Type Finger Protein 1).
Tuy nhiên, Excel theo mặc định lại tự động chuyển giá trị này thành ngày “1-Mar” (1 tháng 3). Tương tự, các tên gen như “SEPT1” hay “DEC1” cũng bị Excel chuyển sai thành ngày 1/9 và 1/12. Tính năng tự động định dạng này có thể tiện lợi trong thống kê tài chính thông thường, nhưng lại gây ra rắc rối nghiêm trọng cho nghiên cứu khoa học.
Hệ quả của “tính năng” này không chỉ dừng lại ở lỗi hiển thị. Một nghiên cứu đăng trên tạp chí Genome Biology năm 2016 cho thấy, khi phân tích 3.597 bài báo khoa học có đính kèm tệp Excel, các nhà nghiên cứu phát hiện khoảng 20% tệp chứa lỗi tên gen do Excel tự động chuyển đổi định dạng.
Trước sự thờ ơ kéo dài của Microsoft, Ủy ban Danh pháp Gen Người HUGO (HGNC) – cơ quan chịu trách nhiệm chuẩn hóa tên gen – buộc phải nhượng bộ. Để tránh việc Excel hiểu sai, vào năm 2020, HGNC đã thay đổi quy tắc đặt tên của khoảng 27 gen, trong đó có MARCH1 (đổi thành MARCHF1). Ông Vignoli cho rằng dù Microsoft đến năm 2023 mới cho phép tắt tính năng này, nhưng thiệt hại và sự “ô nhiễm” dữ liệu khoa học đã không thể cứu vãn.
Ngoài các vấn đề về chức năng, Vignoli còn phân tích sâu hơn sự “giả tạo về mặt kỹ thuật” của định dạng OOXML. Ông chỉ ra rằng tài liệu đặc tả của OOXML dài tới khoảng 7.000 trang, với quy mô khổng lồ khiến hầu như không có nhà phát triển bên thứ ba nào có thể triển khai tương thích đầy đủ và chính xác.
Trớ trêu hơn, theo Vignoli, ngay cả Microsoft Office cũng không tuân thủ chuẩn “Strict” (nghiêm ngặt) do chính mình đặt ra, mà lại sử dụng biến thể “Transitional” (chuyển tiếp), vốn chứa đầy gánh nặng lịch sử.
Tiêu chuẩn này thậm chí còn bao gồm những chỉ thị như “autoSpaceLikeWord95” (tự động giãn cách giống Word 95), yêu cầu phần mềm hiện đại phải mô phỏng hành vi của phần mềm cách đây 30 năm, đồng thời khuyến nghị sử dụng các định dạng đồ họa riêng của Windows thay vì tiêu chuẩn mở SVG phổ biến. Theo TDF, điều này hoàn toàn đi ngược lại tinh thần cốt lõi của các tiêu chuẩn mở.
Nguồn tham khảo
blog.documentfoundation.org
Để minh chứng cho sự coi thường tiêu chuẩn của Microsoft, ông Vignoli dẫn lại một ví dụ nổi tiếng trong giới khoa học: lỗi Excel xử lý sai tên gen. Trong nghiên cứu di truyền học, các nhà khoa học thường dùng ký hiệu chữ – số để đặt tên gen, chẳng hạn như “MARCH1” (Membrane Associated Ring-CH-Type Finger Protein 1).
Tuy nhiên, Excel theo mặc định lại tự động chuyển giá trị này thành ngày “1-Mar” (1 tháng 3). Tương tự, các tên gen như “SEPT1” hay “DEC1” cũng bị Excel chuyển sai thành ngày 1/9 và 1/12. Tính năng tự động định dạng này có thể tiện lợi trong thống kê tài chính thông thường, nhưng lại gây ra rắc rối nghiêm trọng cho nghiên cứu khoa học.
Hệ quả của “tính năng” này không chỉ dừng lại ở lỗi hiển thị. Một nghiên cứu đăng trên tạp chí Genome Biology năm 2016 cho thấy, khi phân tích 3.597 bài báo khoa học có đính kèm tệp Excel, các nhà nghiên cứu phát hiện khoảng 20% tệp chứa lỗi tên gen do Excel tự động chuyển đổi định dạng.
Trước sự thờ ơ kéo dài của Microsoft, Ủy ban Danh pháp Gen Người HUGO (HGNC) – cơ quan chịu trách nhiệm chuẩn hóa tên gen – buộc phải nhượng bộ. Để tránh việc Excel hiểu sai, vào năm 2020, HGNC đã thay đổi quy tắc đặt tên của khoảng 27 gen, trong đó có MARCH1 (đổi thành MARCHF1). Ông Vignoli cho rằng dù Microsoft đến năm 2023 mới cho phép tắt tính năng này, nhưng thiệt hại và sự “ô nhiễm” dữ liệu khoa học đã không thể cứu vãn.
Ngoài các vấn đề về chức năng, Vignoli còn phân tích sâu hơn sự “giả tạo về mặt kỹ thuật” của định dạng OOXML. Ông chỉ ra rằng tài liệu đặc tả của OOXML dài tới khoảng 7.000 trang, với quy mô khổng lồ khiến hầu như không có nhà phát triển bên thứ ba nào có thể triển khai tương thích đầy đủ và chính xác.
Trớ trêu hơn, theo Vignoli, ngay cả Microsoft Office cũng không tuân thủ chuẩn “Strict” (nghiêm ngặt) do chính mình đặt ra, mà lại sử dụng biến thể “Transitional” (chuyển tiếp), vốn chứa đầy gánh nặng lịch sử.
Tiêu chuẩn này thậm chí còn bao gồm những chỉ thị như “autoSpaceLikeWord95” (tự động giãn cách giống Word 95), yêu cầu phần mềm hiện đại phải mô phỏng hành vi của phần mềm cách đây 30 năm, đồng thời khuyến nghị sử dụng các định dạng đồ họa riêng của Windows thay vì tiêu chuẩn mở SVG phổ biến. Theo TDF, điều này hoàn toàn đi ngược lại tinh thần cốt lõi của các tiêu chuẩn mở.
Nguồn tham khảo
Why OOXML is not a standard format for office documents - TDF Community Blog
Unfortunately, I keep reading about open-source software advocates who happily use Microsoft’s proprietary DOCX, XLSX and PPTX formats for their documents and therefore prefer proprietary software such as OnlyOffice to LibreOffice. Others write outrageous things such as: “OOXML is a standard...
blog.documentfoundation.org