Theo: http://ontotext.com/knowledgehub/fundamentals/semantic-web-technology/
Xem thêm: Dữ liệu Mở liên kết - Linked Open Data.
Công nghệ ngữ nghĩa (Semantic Technology), như bản thân cụm từ đó gợi ý, sử dụng các ngữ nghĩa chính thống để đưa ra ý nghĩa cho tất cả các dữ liệu thô và tạp nham bao quanh chúng ta. Công nghệ Web Ngữ nghĩa (Semantic Web Technology) - hoặc công nghệ về Web Dữ liệu hoặc công nghệ Dữ liệu Liên kết (Linked Data) như được nhà phát minh ra World Wide Web, ngài Tim Berners-Lee hình dung - xây dựng các mối quan hệ giữa dữ liệu với các định dạng và các nguồn khác nhau, từ chuỗi này tới chuỗi khác, giúp xây dựng ngữ cảnh và tạo ra các đường liên kết bên ngoài các mối quan hệ đó.
Công nghệ Ngữ nghĩa xác định và liên kết các dữ liệu trên web hoặc bên trong doanh nghiệp bằng việc phát triển các ngôn ngữ để thể hiện các mối quan hệ qua lại giàu có, tự mô tả của dữ liệu ở dạng mà các máy tính có thể xử lý được. Vì thế, máy tính không chỉ có khả năng xử lý các chuỗi dài các ký tự tính toán và đánh chỉ số cho hàng đống các dữ liệu, mà chúng còn có khả năng để lưu trữ, quản lý và truy xuất thông tin dựa vào các mối quan hệ có ý nghĩa và logic. Các ngữ nghĩa bổ sung một lớp khác cho web và có khả năng để chỉ ra các hạng mục sự việc có liên quan thay vì chỉ là các từ trùng khớp nhau.
Ngó qua công nghệ ngữ nghĩa
Các công nghệ cơ bản của Công nghệ Ngữ nghĩa, cơ sở dữ liệu đồ họa ngữ nghĩa (semantic graph), ví dụ thế, sử dụng tập hợp các tiêu chuẩn vạn năng, như được cộng đồng quốc tế Nhóm Word Wide Web (W3C) thiết lập để phát triển các tiêu chuẩn mở.
“Sự khác biệt cốt lõi giữa các Công nghệ Ngữ nghĩa và các công nghệ khác về dữ liệu, ví dụ như cơ sở dữ liệu quan hệ, là Công nghệ Ngữ nghĩa làm việc với ý nghĩa thay vì cấu trúc của dữ liệu”.
Sáng kiến Semantic Web của W3C nêu rằng mục đích của công nghệ này trong ngữ cảnh của web ngữ nghĩa là để tạo ra ‘phương tiện vạn năng để trao đổi dữ liệu’ bằng việc liên kết lẫn nhau một cách trơn tru việc chia sẻ toàn cầu bất kỳ dạng dữ liệu nào, gồm các dữ liệu cá nhân, thương mại, khoa học và văn hóa. W3C đã phát triển các đặc tả mở cho những người phát triển công nghệ ngữ nghĩa để gắn vào và đã nhận diện, qua sự phát triển nguồn mở, các thành phần hạ tầng cần thiết để mở rộng phạm vi trên Web, và có khả năng áp dụng được ở những nơi khác.
Về Công nghệ Ngữ nghĩa, các tiêu chuẩn áp dụng trước hết là Khung Mô tả Tài nguyên - RDF (Resource Description Framework), giao thức SPARQL và ngôn ngữ truy vấn RDF - SPARQL (SPARQL Protocol and RDF Query Language), và tùy chọn Ngôn ngữ Bản thể học Web - OWL (Web Ontology Language).
RDF(S), hoặc bộ 3 (triples), là định dạng mà Công nghệ Ngữ nghĩa sử dụng để lưu trữ dữ liệu trong các cơ sở dữ liệu đồ họa.
SPARQL là ngôn ngữ truy vấn ngữ nghĩa của Web Ngữ nghĩa, nó được thiết kế đặc biệt để truy vấn các dữ liệu qua các hệ thống và các cơ sở dữ liệu khác nhau và để truy xuất và xử lý các dữ liệu được lưu trữ ở định dạng RDF.
OWL (tùy chọn) là ngôn ngữ dựa vào logic tính toán, nó được thiết kế để chỉ ra sơ đồ dữ liệu và trình bày tri thức giàu có và phức tạp của hệ thống tôn ti trật tự của mọi điều và các mối quan hệ giữa chúng. Nó bổ sung cho RDF và cho phép chính thức hóa sơ đồ/bản thể học dữ liệu trong một lĩnh vực cho trước nhất định, tách bạch khỏi bản thân các dữ liệu đó.
Việc sử dụng tất cả các tiêu chuẩn đó, Công nghệ Ngữ nghĩa làm cho cuộc sống dễ dàng hơn bằng việc giúp cho các máy tính giúp đỡ chúng ta cách để tìm đúng mẩu dữ liệu tức thì và cách để lọc các hạng mục để tạo ra giá trị nhiều hơn.
Ứng dụng công nghiệp của Công nghệ Ngữ nghĩa
Công nghệ Ngữ nghĩa giúp những người sử dụng và các doanh nghiệp phát hiện ra các dữ liệu thông minh hơn, kết nối lẫn nhau và trích xuất tri thức từ các tập hợp khổng lồ các dữ liệu thô ở các định dạng khác nhau và từ các nguồn khác nhau. Web Ngữ nghĩa, với công nghệ như GraphDB, làm cho nội dung dữ liệu dễ dàng hơn cho các máy tính để tích hợp, tìm kiếm, truy cập, truy xuất, xử lý và tự động hóa. Điều này, tới lượt nó, cho phép các tổ chức giành được sự truy cập nhanh hơn và có hiệu quả hơn về chi phí tới các dữ liệu có ý nghĩa và chính xác, để phân tích dữ liệu đó và biến nó thành tri thức. Sau đó họ có thể sử dụng tiếp tri thức đó để giành được sự thấu hiểu, áp dụng các mô hình dự đoán và đưa ra các quyết định được dữ liệu dẫn dắt.
Các doanh nghiệp khác nhau đang sử dụng rồi các công nghệ ngữ nghĩa và các cơ sở dữ liệu đồ họa để quản lý nội dung của họ, để tái mục đích và sử dụng lại thông tin, để cắt giảm các chi phí và giành được các dòng doanh thu mới. BBC, FT, và Elsevier sử dụng xuất bản ngữ nghĩa; trong y tế và các khoa học đời sống Astra Zeneca cũng sử dụng công nghệ ngữ nghĩa. Các công ty bảo hiểm và giới công nghiệp tài chính cũng đã bắt đầu áp dụng các công nghệ để làm giàu nội dung theo ngữ nghĩa và truy cập và xử lý các dữ liệu phức tạp và hỗn tạp. Thương mại điện tử, giới công nghiệp ô tô, chính phủ và khu vực nhà nước, các nhà cung cấp công nghệ, lĩnh vực năng lượng, lĩnh vực các dịch vụ, trong số các lĩnh vực khác, cũng đang sử dụng các nhà phát triển công nghệ ngữ nghĩa để trích xuất tri thức từ dữ liệu bằng việc gắn ý nghĩa cho các tập hợp dữ liệu khác nhau.
Ý nghĩa, đây là những gì Web Ngữ nghĩa nhắm tới
Đầu năm 2007, ngài Berners-Lee đã nói với Bloomberg “Công nghệ Ngữ nghĩa vốn dĩ không phức tạp. Ngôn ngữ Công nghệ Ngữ nghĩa, ở trong tâm của nó, là rất, rất đơn giản. Nó chỉ là về các mối quan hệ giữa mọi điều”. Các cơ hội là ‘các mối quan hệ giữa tất cả mọi điều’ sẽ làm cho cuộc sống của tất cả những người sử dụng dễ dàng hơn và sẽ giúp cho các tổ chức quản lý dữ liệu có hiệu quả hơn để tạo ra các dữ liệu ngày càng thông minh hơn và giành được giá trị nhiều hơn.
Semantic Technology, as the phrase itself suggests, uses formal semantics to give meaning to all the disparate and raw data that surrounds us. The Semantic Web Technology – or technology for the Web of Data or the Linked Data technology as envisioned by World Wide Web inventor Sir Tim Berners-Lee – builds relationships between data in various formats and sources, from one string to another, helping build context and creating links out of those relationships.
The Semantic Technology defines and links data on the web or within an enterprise by developing languages to express rich, self-describing interrelations of data in a form that machines can process. Thus, machines are not only able to process long computing strings of characters and index tons of data, but they are also able to store, manage and retrieve information based on meaning and logical relations. Semantics adds another layer to the web and is able to show related factsitems instead of just word matching.
The principal technologies of the Semantic Technology, the semantic graph database for example, use a set of universal standards, as set down by the World Wide Web Consortium (W3C) international community that develops open standards.
“The core difference between Semantic Technologies and other technologies for data, the relational database for instance, is that the Semantic Technology deals with the meaning rather than the structure of the data.
W3C’s Semantic Web initiative states that the purpose of this technology in the context of the semantic web to create a ‘universal medium for the exchange of data’ by smoothly interconnecting the global sharing of any kind of personal, commercial, scientific and cultural data. W3C has developed open specifications for the semantic technology developers to stick to and has identified, via open source development, the infrastructure parts that will be needed to scale in the Web, and applicable elsewhere .
In terms of Semantic Technology, the standards that apply are primarily the Resource Description Framework (RDF), SPARQL (SPARQL Protocol and RDF Query Language), and optionally OWL (Web Ontology Language).
RDF(S), or triples, is the format the Semantic Technology uses to store data in graph databases.
SPARQL is the semantic query language of the Semantic Web, which is specifically designed to query data across various systems and databases and to retrieve and process data stored in RDF format.
(optionally) OWL is the computational logic-based language which is designed to show the data schema and represents rich and complex knowledge about hierarchies of things and the relations between things. It is complementary to RDF and allows for formalizing a data schema/ontology in a given domain, separately from the data itself.
Using all those standards, the Semantic Technology makes life easier by helping computers help us how to find the right data piece right away and how to filter items to create more value.
Semantic Technology helps users and enterprises discover smarter data, infer links and extract knowledge from enormous sets of raw data in various formats and from various sources. The Semantic Web, let’s say that a technology such as GraphDB , makes data content easier for machines to integrate, find, access, retrieve, process and automate. This, in turn, enables organizations to gain faster and more cost-effective access to meaningful and accurate data, to analyze that data and turn it into knowledge. Then they can further use that knowledge to gain insights, apply predictive models and make data-driven decisions.
Various businesses are already using semantic technologies and graph databases to manage their content, repurpose and reuse information, cut costs and gain new revenue streams. The BBC, FT and Elsevier use semantic publishing; in healthcare and life sciences Astra Zeneca also uses semantic technology. The financial industry and insurance companies have also started adopting technologies to semantically enrich content and access and process complex and heterogeneous data. E-commerce, the automotive industry, the government and public sector, technology providers, the energy sector, the services sector, among others, are also employing semantic technology developers to extract knowledge from data by attributing meaning to various datasets.
As early as in 2007, Sir Berners-Lee told Bloomberg “The Semantic Technology isn’t inherently complex. The Semantic Technology language, at its heart, is very, very simple. It’s just about the relationships between things.”
Chances are that the ‘relationships between things’ will make the lives of all users easier and will help organizations manage data more efficiently to create more and more smarter data and gain more value.
Dịch: Lê Trung Nghĩa
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...