Cơ bản về GraphDB™

Thứ ba - 25/04/2017 06:41

GraphDB ™ Fundamentals

Theo: http://ontotext.com/knowledgehub/fundamentals/graphdb-fundamentals/

Xem thêm: Dữ liệu Mở liên kết - Linked Open Data.

Cơ bản về GraphDB™

Những điều cơ bản về GraphDB™ xây dựng cơ sở để làm việc với các cơ sở dữ liệu đồ thị sử dụng các tiêu chuẩn của W3C và đặc biệt GraphDB™. Đây là lớp huấn luyện đã đưa ra hàng loạt 9 video sẽ đi với bạn trong các bước đầu sử dụng các cơ sở dữ liệu đồ thị triplestore.

Học những điều cơ bản về các tiêu chuẩn của W3C cho các cơ sở dữ liệu đồ thị theo 3 chủ đề chính: RDF & RDFS, SPARQL và Bản thể học (Ontology).
Đi theo với các chỉ dẫn cài đặt và thiết lập cấu hình GraphDB để bắt đầu với các truy vấn đầu tiên của bạn hoặc tải các tập hợp dữ liệu của bạn.
Cuối cùng có được tối đa sự hiểu biết về chức năng của GraphDB, các chiến lược với các lý do của nó; RDFRank, không gian địa lý Geo-spatial và các mở rộng tìm kiếm toàn văn; và nơi nào để bắt đầu khi có hỏng hóc.

Đừng quên một điều - đăng ký kênh YouTube của bạn - và đi theo chúng tôi trên Twitter

Module 1 – RDF(S)

RDF là định dạng được tiêu chuẩn hóa cho trình bày dữ liệu đồ thị. Module này giới thiệu RDF, những gì RDFS thêm vào nó, và cách sử dụng nó bằng những ví dụ đễ đi theo từ biếm họa “Flintstones”.

Video 1: https://www.youtube.com/watch?v=iuQrBf2Oq-E

Module 2 – SPARQL

SPARQL là ngôn ngữ truy vấn tương tự như SQL cho dữ liệu RDF. Nó được thừa nhận như là một trong những công cụ chính của công nghệ Ngữ nghĩa và từng được W3C làm thành tiêu chuẩn. Module này đề cập tới cơ bản về SPARQL, đủ để tạo cho bạn đồ thị RDF đầu tiên và chạy các truy vấn SPARQL đầu tiên của bạn.

Video 2: https://www.youtube.com/watch?v=L_eB7Z84M4c

Module 3 - Bản thể học

Module này xem xét các bản thể học – Ontologies: bản thể học là gì; dạng tài nguyên nào nó mô tả; và đâu là những lợi ích của việc sử dụng bản thể học. Bản thể học là cốt lõi của cách thức chúng ta mô hình hóa tri thức theo ngữ nghĩa. Chúng là một phần của tất cả các tập hợp Dữ liệu Liên kết.

Video 3: https://www.youtube.com/watch?v=V27-f0KzIB0

Module 4 - Cài đặt GraphDB

Video này chỉ dẫn bạn qua 5 bước trong việc thiết lập GraphDB của bạn: từ việc tải về và triển khai các tệp war tới Máy chủ Ứng dụng Tomcat của bạn, qua việc khởi tạo Workbench (công cụ quản trị GraphDB), tới việc cuối cùng tạo cơ sở dữ liệu và chèn vào và lựa chọn dữ liệu trong nó. Ví dụ ưa thích của chúng tôi từ Flintstones là sẵn sàng ở đây như là dữ liệu để bạn bắt đầu.

Video 4: https://www.youtube.com/watch?v=0Z12oMX7prM

Module 5 - Tinh chỉnh hiệu năng & mở rộng phạm vi

Module này cung cấp thông tin về cách thiết lập cấu hình cho GraphDB để có hiệu năng và khả năng mở rộng phạm vi tối ưu. Kích cỡ của các tập hợp dữ liệu và các trường hợp điển hình hưởng lợi từ các cấu hình bộ nhớ GraphDB khác nhau.

Hãy xem video này để học được nhiều hơn về 4 yếu tố bạn có thể kiểm soát cũng như cách sử dụng công cụ cấu hình GraphDB. Các gợi ý về dành riêng bộ nhớ trong thời gian tải và vận hành bình thường cũng được đưa ra.

Video 5: https://www.youtube.com/watch?v=YViWiinKjtc

Module 6 – GraphDB Workbench & Sesame

GraphDB Workbench là công cụ quản trị dựa vào web mà cho phép bạn quản lý các kho GDB, tải và xuất khẩu dữ liệu, giám sát thực thi truy vấn, phát triển và thực thi các truy vấn, quản lý các kết nối và những người sử dụng. Trong video này chúng tôi cung cấp tổng quan ngắn gọn chức năng chính mà bạn sẽ sử dụng hầu hết mọi lúc.

Video 6: https://www.youtube.com/watch?v=5P9jZLlZtEk

Module 7 - Tải dữ liệu

Dữ liệu là tài sản có giá trị nhất và GraphDB được thiết kế để lưu trữ và cải tiến nó. Module này chỉ cho bạn cách sử dụng GraphDB Workbench để tải các tệp riêng rẽ và đánh đống dữ liệu từ các thư mục. Đối với các tập hợp dữ liệu khổng lồ thì chúng tôi khuyến cáo tăng tốc độ quy trình đó bằng việc sử dụng trình tải đánh đống Parallel (song song).

Video 7: https://www.youtube.com/watch?v=ZxQo1GMHvO4

Module 8 – Tập hợp quy tắc & các chiến lược lập luận

Module này đưa ra các chiến lược lập luận (cách để có thông tin mới từ dữ liệu của bạn) cũng như tập hợp quy tắc được GraphDB sử dụng. 3 chiến lược lập luận khác nhau được thảo luận là: xâu chuỗi tiến, xâu chuỗi lùi, xâu chuỗi hỗn hợp. Chúng hỗ trợ cho sự tối ưu hóa lập luận khác nhau của GraphDB, nghĩa là sử dụng owl:SameAs

Video 8: https://www.youtube.com/watch?v=iZAs1ec8lT4

Module 9 - Các mở rộng

Module này trình bày 3 mở rộng trang bị cho các truy vấn RDFRank của GraphDB tính toán các kết nối của các nút - tương tự với thuật toán PageRank (Xếp hạng trang) nổi tiếng.
Các truy vấn không gian địa lý trích xuất dữ liệu được đặt trong các hình tam giác, các hình đa giác và các hình tròn.
Tìm kiếm toàn văn đưa ra đánh giá nhanh hơn cho dữ liệu văn bản dựa vào Apache Lucene, Solr và ElasticSearch

Video 9: https://www.youtube.com/watch?v=zx60xwCExM8

Module 10 - Sửa chữa hỏng hóc

Module này đề cập tới việc sửa chữa hỏng hóc cho vài vấn đề phổ biến. Các vấn đề đó bao gồm cả các vấn đề cài đặt và vận hành. Các vấn đề cài đặt bao gồm: Workbench, Lucene, Informatiq và các tệp quy tắc tùy biến. Các vấn đề vận hành gồm: các tính toán lệnh, xóa các lệnh và socket timeouts.

Video 10: https://www.youtube.com/watch?v=LsseidUdxRg

GraphDB™ Fundamentals

GraphDB™ Fundamentals builds the basis for working with graph databases that utilize the W3C standards and particularly GraphDB™. It is a training class delivered in a series of nine videos that will accompany you in your first steps of using triplestore graph databases.

Learn the fundamentals of W3C standards for graph databases in the first three topics: RDF & RDFS, SPARQL and Ontology.
Follow with GraphDB installation and set-up instructions to start with your firs query or load your datasets.
Finally get maximum of GraphDB functionality understanding its reasoning strategies; RDFRank, Geo-spatial and Full-Text-Search extensions; and where to start while troubleshooting.

Don’t miss a thing – subscribe to our YouTube channel – and follow us on Twitter

Module 1 – RDF(S)

RDF is a standardized format for graph data representation. This module introduces RDF, what RDFS adds to it, and how to use it by easy-to-follow examples from “The Flintstones” cartoon.

Video 1: https://www.youtube.com/watch?v=iuQrBf2Oq-E

Module 2 – SPARQL

SPARQL is a SQL-like query language for RDF data. It is recognized as one of the key tools of the Semantic technology and was made a standard by W3C. This module covers the basis of SPARQL, sufficient to create you first RDF graph and run you first SPARQL queries.

Video 2: https://www.youtube.com/watch?v=L_eB7Z84M4c

Module 3 – Ontology

This module looks at Ontologies: what is ontology; what kind of resources does it describe; and what are the benefits of using ontologies. Ontologies are the core of how we model knowledge semantically. They are part of all Linked Data sets.

Video 3: https://www.youtube.com/watch?v=V27-f0KzIB0

Module 4 – GraphDB Installation

This video guides you through five steps in setting up your GraphDB: from downloading and deploying war files to your Tomcat Application Server, through launching Workbench, to final creation of a database and inserting and selecting data in it. Our favourite example from The Flintstones is available here as data for you to start with.

Video 4: https://www.youtube.com/watch?v=0Z12oMX7prM

Module 5 – Performance Tuning & Scalability

This module provides information on how to configure GraphDB for optimal performance and scalability. The size of datasets and the specific use cases benefit from different GraphDB memory configurations.

Watch this video to learn more about the four elements you can control as well as how to use GraphDB configuration tool. Tips about memory dedication during loading time and normal operation are provided as well.

Video 5: https://www.youtube.com/watch?v=YViWiinKjtc

Module 6 – GraphDB Workbench & Sesame

GraphDB Workbench is a web-based administration tool that allows you to manage GDB repositories, load and export data, monitor query execution, developing and executing queries, managing connectors and users. In this video we provide brief overview of the main functionality that you’ll be using most of the time.

Video 6: https://www.youtube.com/watch?v=5P9jZLlZtEk

Module 7 – Loading Data

Data is the most valuable asset and GraphDB is designed to store and enhance it. This module shows you how to use GraphDB Workbench to load individual files and bulk data from directories. For huge datasets we recommend speeding up the process by using Parallel bulk loader.

Video 7: https://www.youtube.com/watch?v=ZxQo1GMHvO4

Module 8 – Rule Set & Reasoning Strategies

This module outlines the reasoning strategies (how to get new information from your data) as well as the rule set that are used by GraphDB. The three different reasoning strategies that are discussed are: forward chaining, backward chaining, hybrid chaining. They support various GraphDB Reasoning optimization e.g. using owl:SameAs

Video 8: https://www.youtube.com/watch?v=iZAs1ec8lT4

Module 9 – Extensions

This module presents three extensions that empower GraphDB queries RDFRank calculates connectives of notes – similar to well known PageRank algorithm.
Geo-spatial queries extracts data placed in rectangles, polygons and circles
Full test search provides faster assess to textual data based on Apache Lucene, Solr and ElasticSearch

Video 9: https://www.youtube.com/watch?v=zx60xwCExM8

Module 10 – Troubleshooting

This module covers troubleshooting some common issues. These issues include both installation and operational issues. Installation issues covered include: Workbench, Lucene, Informatiq and custom rule files. Operational issues covered include: statement counts, deleting statements and socket timeouts.

Video 10: https://www.youtube.com/watch?v=LsseidUdxRg

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com