Kho ngữ nghĩa là gì?

Thứ hai - 24/04/2017 05:59

What is Semantic Repository?

Theo: http://ontotext.com/knowledgehub/fundamentals/semantic-repository/

Xem thêm: Dữ liệu Mở liên kết - Linked Open Data.


 

Các kho ngữ nghĩa là các động cơ tương tự như các hệ thống quản lý cơ sở dữ liệu – DBMS (database management systems). Chúng cho phép lưu trữ, truy vấn, và quản lý các dữ liệu có cấu trúc. Những khác biệt chính với DBMS có thể được tóm tắt như sau:

  • Chúng sử dụng các bản thể học như là lược đồ ngữ nghĩa. Điều này cho phép chúng tự động suy luận về dữ liệu

  • Chúng làm việc với các mô hình dữ liệu vật lý chung và mềm dẻo (như các đồ thị). Điều này cho phép chúng dễ dàng giải nghĩa và áp dụng “ngay được” (on the fly) các bản thể học hoặc các lược đồ siêu dữ liệu mới.

Kết quả là, các kho ngữ nghĩa chào sự tích hợp các dữ liệu đa dạng khác nhau dễ dàng hơn và sức mạnh phân tích nhiều hơn. Để minh họa sự hữu ích của giải thích (hoặc lý do) được tự động hóa, hãy cân nhắc truy vấn về các công ty viễn thông ở châu Âu; đưa ra bản thể học đơn giản, nó xác định ngữ nghĩa của các mối quan hệ lồng nhau của lĩnh vực công nghiệp và vị trí, kho ngữ nghĩa có thể trả về kết quả nhà vận hành di động đang hoạt động ở Vương quốc Anh.

Trong thập kỷ vừa qua, Web Ngữ nghĩa (Semantic Web)đã nổi lên như một lĩnh vực nơi mà các kho ngữ nghĩa đã trở nên quan trọng như các máy chủ HTTP. Xu thế này đã dẫn tới mối quan tâm và hoạt động rất cao trong lĩnh vực này và đã tạo ra một số tiêu chuẩn bản thể học và siêu dữ liệu mạnh, được các quy trình cộng đồng do W3C dẫn dắt phân phối, nổi bật nhất trong số chúng là RDF(S) OWL. Các tiêu chuẩn được nêu tên có vai trò tương tự như vai trò mà SQL đã đóng trong sự phát triển và lan truyền DBMS quan hệ. Dù ban đầu được thiết kế để sử dụng trong Web Ngữ nghĩa, thì các tiêu chuẩn đó đã được chấp nhận rộng rãi trong các lĩnh vực như Tích hợp Ứng dụng Doanh nghiệp và các khoa học đời sống.

Sesame là một trong các kho ngữ nghĩa phổ biến nhất hỗ trợ RDF(S) và tất cả các cú pháp chính và các ngôn ngữ truy vấn có liên quan tới nó. GraphDB™ là kho ngữ nghĩa khác, được đóng gói như là kho và lớp suy diễn (SAIL) cho Sesame. GraphDB™ sử dụng động cơ TRREE để kết hợp RDFS, OWL DLP, và OWL Horst hỗ trợ với lý luận hiệu năng cao và chiến lược thường trực đáng tin cậy.

Vì thế cho tới nay chưa có khái niệm được đồng thuận và chưa được xác định tốt cho những gì đã được mô tả ở trên như là “kho ngữ nghĩa”. Danh sách chưa vét cạn các từ đồng nghĩa yếu là như sau: nhà lý luận, máy chủ bản thể học, kho ngữ nghĩa, siêu kho (metastore), cơ sở dữ liệu RDF. Như một quy tắc, cách nói khác nhau là sự phản ánh những khác biệt nằm bên dưới sự triển khai, thực thi, ứng dụng có ý định, … Mô tả được nêu ở trên cố gắng bao phủ chức năng cốt lõi được đa số lớn các công cụ chào được tóm tắt bằng tên “kho ngữ nghĩa”.

Semantic repositories are engines similar to database management systems (DBMS). They allow for storage, querying, and management of structured data. The major differences with the DBMS are can be summarized as follows:

  • They use ontologies as semantic schemata. This allows them to automatically reason about the data

  • They work with flexible and generic physical data models (e.g. graphs). This allows them to easily interpret and adopt “on the fly” new ontologies or metadata schemata

As a result, semantic repositories offer easier integration of diverse data and more analytical power. To illustrate the usefulness of the automated interpretation (or reasoning), consider a query about telecom companies in Europe; given a simple ontology, which defines the semantics of the location and industry sector nesting relationships, a semantic repository can return as a result a mobile operator operating in the UK.

Over the last decade, the Semantic Web emerged as an area where the semantic repositories become as important as the HTTP servers. This tendency led to very high interest and activity in the field and resulted in a number of robust metadata and ontology standards, delivered by the W3C-driven community processes, most notable among which are RDF(S) and OWL. The named standards have a role similar to the role SQL played for the development and for the spread of the relational DBMS. Although primarily designed for use within the Semantic Web, the standards were widely accepted in areas like Enterprise Application Integration and life sciences.

Sesame is one of the most popular semantic repositories that supports RDF(S)and all the major syntaxes and query languages related to it. GraphDB™ is another semantic repository, packaged as a storage and inference layer (SAIL) for Sesame. GraphDB™ uses the TRREE engine to combine RDFS, OWL DLP, and OWL Horst support with high-performance reasoning and reliable persistence strategy.

Thus far there is no agreed upon and well-defined term for what were described above as a “semantic repository”. A non-exhaustive list of weak synonyms is as follows: reasoner, ontology server, semantic store, metastore, RDF database. As a rule, the different wording is a reflection of the differences underlying the implementation, performance, intended application, etc. The description given above tries to cover the core functionality offered by the vast majority of the tools summarized under the name “semantic repository”.

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com


 

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Những tin mới hơn

Những tin cũ hơn

Về Blog này

Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...

Bài đọc nhiều nhất trong năm
Thăm dò ý kiến

Bạn quan tâm gì nhất ở mã nguồn mở?

Thống kê truy cập
  • Đang truy cập138
  • Máy chủ tìm kiếm3
  • Khách viếng thăm135
  • Hôm nay8,638
  • Tháng hiện tại367,023
  • Tổng lượt truy cập31,845,349
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây