Tháng trước, tôi đã yêu cầu bạn hình dung về tương lai của SEO với trọng tâm là Tối ưu hóa đối tượng khi tôi phỏng vấn nhà chiến lược ngữ nghĩa kỳ cựu https://light.com.vn. Chúng tôi đã thảo luận về một “công cụ trả lời” sử dụng các “thực thể” có liên quan, có thể nhận dạng bằng máy trên các trang Web để trả lời các truy vấn cụ thể, được tinh chỉnh tốt.
1. Cập nhật Hummingbird
Vào ngày 26 tháng 9, Google đã tiến thêm một bước nữa để trở thành công cụ trả lời đó với bản cập nhật Hummingbird. Trong blog trực tiếp của Danny Sullivan về thuật toán Hummingbird, anh ấy giải thích cách Google đang nhanh chóng áp dụng công nghệ Web ngữ nghĩa trong khi vẫn giữ lại các phần của thuật toán cũ . Đây là giải pháp của Google để phát triển từ liên kết văn bản thành câu trả lời. Hệ thống như vậy sẽ hiển thị kết quả chính xác nhanh hơn, vì nó dựa trên công nghệ ngữ nghĩa tập trung vào mục đích của người dùng hơn là vào các cụm từ tìm kiếm.
Để đánh giá tiến trình của Google theo hướng này: đầu tiên là Sơ đồ tri thức, sau đó là Tìm kiếm bằng giọng nói và Google Hiện hành – tất cả đều cung cấp câu trả lời và đôi khi còn đoán trước được các câu hỏi. Để đưa ra những câu trả lời này, Google dựa vào các thực thể chứ không phải từ khóa.
2. “Thực thể” là gì?
Đối với mục đích của bài viết này, thực thể là người, địa điểm hoặc sự vật. Một cách để giới thiệu các thực thể là nhận ra rằng Sơ đồ tri thức của Google là một biểu đồ thực thể và đại diện cho bước đầu tiên của Google trong việc sử dụng tìm kiếm ngữ nghĩa (hoặc tìm kiếm thực thể).
“Tìm kiếm thực thể” là gì? Hãy giữ cho nó đơn giản – về cơ bản đó là một phương pháp chính xác hơn để bot hiểu ý định của người dùng trong khi ánh xạ các nguồn đã được xác minh bổ sung để trả lời một truy vấn tìm kiếm.
3. Không cấu trúc Vs. Dữ liệu có cấu trúc
Trong hai thập kỷ qua, Internet, công cụ tìm kiếm và người dùng Web đã phải đối phó với dữ liệu phi cấu trúc, về cơ bản là bất kỳ dữ liệu nào chưa được tổ chức hoặc phân loại theo bất kỳ loại mô hình dữ liệu nào được xác định trước. Do đó, các công cụ tìm kiếm có thể xác định các mẫu trong các trang web (từ khóa) nhưng không thực sự có thể gắn ý nghĩa cho các trang đó.
Tìm kiếm ngữ nghĩa cung cấp một phương pháp để phân loại dữ liệu bằng cách gắn nhãn mỗi phần thông tin là một thực thể – điều này được gọi là dữ liệu có cấu trúc. Hãy xem xét dữ liệu sản phẩm bán lẻ, dữ liệu này chứa một lượng lớn thông tin phi cấu trúc. Dữ liệu có cấu trúc cho phép các nhà bán lẻ và nhà sản xuất cung cấp dữ liệu sản phẩm cực kỳ chi tiết và chính xác để các công cụ tìm kiếm (máy móc / bot) sử dụng, hiểu, phân loại và liên kết với nhau dưới dạng một chuỗi thông tin đã được xác minh.
Tìm kiếm theo ngữ nghĩa hoặc thực thể sẽ tối ưu hóa nhiều hơn là chỉ dữ liệu sản phẩm bán lẻ. Hãy xem các loại lược đồ của Schema.org – các lược đồ này đại diện cho ngôn ngữ kỹ thuật cần thiết để tạo một Web dữ liệu có cấu trúc (các thực thể có số nhận dạng duy nhất) – và điều này trở nên có thể đọc được bằng máy. Dữ liệu có cấu trúc có thể đọc được bằng máy được phân định rõ ràng và đáng tin cậy hơn; nó có thể được xác minh chéo khi so sánh với các nguồn dữ liệu thực thể được liên kết khác (số nhận dạng duy nhất) trên Web.
4. Dữ liệu có cấu trúc, Bộ ba & Bộ ba
Tìm kiếm theo ngữ nghĩa sử dụng từ vựng như giao thức Open Graph của Facebook hoặc cú pháp như RDFa hoặc vi dữ liệu để tạo dữ liệu có cấu trúc. Dữ liệu có cấu trúc có thể được nhập và xuất từ các cửa hàng triplestores. Hãy đợi ở đó và chịu đựng với tôi trong một phút…
Bộ ba là một cơ sở dữ liệu để lưu trữ và truy xuất bộ ba. Triplestores được tối ưu hóa cho việc lưu trữ và truy xuất bộ ba; chúng có thể lưu trữ hàng tỷ bộ ba.
Bộ ba là gì? Để đơn giản hóa, chúng ta hãy chia nhỏ một câu: sự kết hợp của ba phần của bài phát biểu tạo thành bất kỳ câu nào bao gồm Chủ ngữ, Vị ngữ và Đối tượng – cũng được các nhà chiến lược ngữ nghĩa gọi là Bộ ba. Bộ ba về cơ bản là các thực thể được liên kết bao gồm chủ ngữ-vị ngữ-tân ngữ. Các đối tượng là người / điều mà thực hiện các hành động của động từ. Vị ngữ là hành động mà chủ ngữ thực hiện. Đối tượng là người / vật mà hành động được thực hiện.
Ví dụ đơn giản về bộ ba: Bà Keller đang dạy Đại số.
- Bà Keller → chủ thể → một thực thể
- Đại số → đối tượng → một thực thể
- Đang dạy → vị ngữ hoặc quan hệ → liên kết các thực thể
Bộ ba được biểu thị dưới dạng Mã định danh tài nguyên đồng nhất (URI). Công cụ trả lời sẽ truy xuất dữ liệu rất cụ thể từ cơ sở dữ liệu lớn của bộ ba lưu trữ hàng tỷ bộ ba và liên kết hàng tỷ chủ thể, đối tượng và vị từ để tạo thành các mối quan hệ. Kết quả là các câu trả lời chính xác hơn cho các truy vấn của chúng tôi bằng cách xác minh nội bộ dữ liệu đã được xác thực và các mối quan hệ liên kết đến các tài liệu đáng tin cậy (dữ liệu có cấu trúc).