<!DOCTYPE html>
    <html lang="vi" xmlns="http://www.w3.org/1999/xhtml" prefix="og: http://ogp.me/ns#">
    <head>
<title>Bài 12 - Tìm kiếm dữ liệu ẩn trên Web</title>
<meta name="description" content="Bài 12 - Tìm kiếm dữ liệu ẩn trên Web - Savefile - Blogs - https&#x3A;&#x002F;&#x002F;letrungnghia.mangvn.org&#x002F;savefile&#x002F;Education&#x002F;bai-12-tim-kiem-du-lieu-an-tren-web-6377.html">
<meta name="author" content="Blog FOSS by Lê Trung Nghĩa">
<meta name="copyright" content="Blog FOSS by Lê Trung Nghĩa [webmaster@vinades.vn]">
<meta name="generator" content="NukeViet v4.5">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta property="og:title" content="Bài 12 - Tìm kiếm dữ liệu ẩn trên Web">
<meta property="og:type" content="website">
<meta property="og:description" content="Savefile - Blogs - https&#x3A;&#x002F;&#x002F;letrungnghia.mangvn.org&#x002F;savefile&#x002F;Education&#x002F;bai-12-tim-kiem-du-lieu-an-tren-web-6377.html">
<meta property="og:site_name" content="Blog FOSS by Lê Trung Nghĩa">
<meta property="og:url" content="https://letrungnghia.mangvn.org/savefile/Education/bai-12-tim-kiem-du-lieu-an-tren-web-6377.html">
<link rel="shortcut icon" href="https://letrungnghia.mangvn.org/favicon.ico">
<link rel="canonical" href="https://letrungnghia.mangvn.org/savefile/Education/bai-12-tim-kiem-du-lieu-an-tren-web-6377.html">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/" title="Blogs" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Government/" title="Blogs - Government" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Policy/" title="Blogs - Policy" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Philosophy/" title="Blogs - Philosophy" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Security/" title="Blogs - Security" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Legal/" title="Blogs - Legal" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Education/" title="Blogs - Education" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Business/" title="Blogs - Business" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Community/" title="Blogs - Community" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Interoperability/" title="Blogs - Interoperability" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Standards/" title="Blogs - Standards" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Author/" title="Blogs - Author" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Opinions/" title="Blogs - Opinions" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/CC/" title="Blogs - CC" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Cloud/" title="Blogs - Cloud" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Hardware/" title="Blogs - Hardware" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Software/" title="Blogs - Software" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Statistics/" title="Blogs - Statistics" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Trends/" title="Blogs - Trends" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/China/" title="Blogs - China" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/OSs/" title="Blogs - OSs" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Blogs/" title="Blogs - Blogs" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Outsourcing/" title="Blogs - Outsourcing" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/elearning/" title="Blogs - Elearning" type="application/rss+xml">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/assets/css/font-awesome.min.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/bootstrap.non-responsive.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/style.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/style.non-responsive.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/news.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/custom.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/assets/css/default.vi.1106.css" type="text/css">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/jquery/jquery.min.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/language/vi.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/DOMPurify/purify3.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/global.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/site.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/themes/default/js/news.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/themes/default/js/main.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/themes/default/js/custom.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/themes/default/js/bootstrap.min.js" type="text/javascript">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/assets/css/font-awesome.min.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/themes/default/css/bootstrap.non-responsive.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/themes/default/css/style.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/themes/default/css/style.non-responsive.css">
<link rel="StyleSheet" href="https://letrungnghia.mangvn.org/themes/default/css/news.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/themes/default/css/custom.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/assets/css/default.vi.1106.css">
<style type="text/css">
	body{background: #fff;}
</style>
<script>(function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
(i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
})(window,document,'script','https://www.google-analytics.com/analytics.js','ga');
ga('create', 'UA-70254229-3', '');
ga('send', 'pageview');
</script>
</head>
    <body>
<div id="print">
	<div id="hd_print">
		<h2 class="pull-left">Blog FOSS by Lê Trung Nghĩa</h2>
		<p class="pull-right"><a title="Blog FOSS by Lê Trung Nghĩa" href="https://letrungnghia.mangvn.org/">https://letrungnghia.mangvn.org</a></p>
	</div>
	<div class="clear"></div>
	<hr />
	<div id="content">
		<h1>Bài 12 - Tìm kiếm dữ liệu ẩn trên Web</h1>
		<ul class="list-inline">
			<li>Thứ sáu - 20/03/2020 05:19</li>
			<li class="hidden-print txtrequired"><em class="fa fa-print">&nbsp;</em><a title="In ra" href="javascript:;" onclick="window.print()">In ra</a></li>
			<li class="hidden-print txtrequired"><em class="fa fa-power-off">&nbsp;</em><a title="Đóng cửa sổ này" href="javascript:;" onclick="window.close()">Đóng cửa sổ này</a></li>
		</ul>
		<div class="clear"></div>
		<div id="hometext">
		</div>
				<div class="imghome">
			<img alt="Bài 12 - Tìm kiếm dữ liệu ẩn trên Web" src="https://1.bp.blogspot.com/-tdj7WWtcfOg/XnPt9DqT-sI/AAAAAAAARfQ/CfOGh4t12IIM8-c8Z19UJ-S8CieN-pH6QCLcBGAsYHQ/s640/odi-001.jpg" width="460" class="img-thumbnail" />
		</div>
		<div class="clear"></div>
		<div id="bodytext" class="clearfix">
			<div class="post-body entry-content" id="post-body-6897965234236833174" itemprop="description articleBody">&nbsp;
<h1 class="western" style="margin-left: -0.01cm; text-align: justify;">Tìm kiếm dữ liệu ẩn trên Web</h1>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">‘Dữ liệu mở’ không chỉ ngụ ý các tập hợp dữ liệu sẵn sàng để tải về. Dữ liệu mở tải về được chỉ đại diện cho phần nhỏ các dữ liệu sẵn sàng trên Web.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Đa số dữ liệu sẵn sàng trên Web là ẩn khỏi mắt người. Tuy nhiên, các máy có thể tìm thấy và đọc được các dữ liệu đó.</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Trong bài này chúng ta sẽ khai thác những điều sau:</b></div>

<ul style="text-align: justify;">
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Định vị dữ liệu ẩn như thế nào</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Những lợi ích của dữ liệu ẩn có thể cung cấp là gì</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Làm thế nào để có được dữ liệu ẩn</div>
	</li>
</ul>

<div class="western" style="line-height: 110%; margin-bottom: 0cm; margin-left: 0.64cm; margin-right: 0.01cm; text-align: justify;">&nbsp;</div>

<h1 class="western" style="margin-left: -0.01cm; text-align: justify;">Tìm kiếm dữ liệu ẩn - trong 2 phút</h1>

<div class="western" style="line-height: 110%; margin-bottom: 0.72cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Giảng viên David Tarrant của ODI giải thích dữ liệu ẩn là gì, những lợi ích nào nó có thể cung cấp và làm thế nào bạn có thể có được nó.</div>

<h1 class="western" style="margin-left: -0.01cm; text-align: justify;">Dữ liệu người không thể nhìn thấy</h1>

<div align="center" class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm;">
<div class="separator" style="clear:both; text-align:center"><a href="https://1.bp.blogspot.com/-tdj7WWtcfOg/XnPt9DqT-sI/AAAAAAAARfQ/CfOGh4t12IIM8-c8Z19UJ-S8CieN-pH6QCLcBGAsYHQ/s1600/odi-001.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img alt="" border="0" data-original-height="430" data-original-width="430" height="640" src="https://1.bp.blogspot.com/-tdj7WWtcfOg/XnPt9DqT-sI/AAAAAAAARfQ/CfOGh4t12IIM8-c8Z19UJ-S8CieN-pH6QCLcBGAsYHQ/s640/odi-001.jpg" width="640" /></a></div>
</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Dữ liệu không luôn dễ dàng tìm ra trên Web, vì hầu hết các tài nguyên sẵn sàng chỉ nhìn thấy được đối với máy. Con người điều hướng Web một cách trực quan nhìn thấy được, xem nội dung, nhấn vào các đường liên kết và tải về các tệp.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Máy, ngược lại, chỉ điều hướng Web qua các quy tắc logic được đặt ra trong mã. Trong khi con người tìm kiếm nội dung hấp dẫn, tương tác, thì máy yêu cầu cấu trúc, logic và sự rõ ràng.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Sự khác biệt này tạo ra ‘các điểm mù’ về cách thức con người và máy đọc Web.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Ví dụ, máy không luôn có thể tức thì tìm ra một đường liên kết tải về trên một trang; con người thấy khó để xem dữ liệu có cấu trúc, không trực quan có trong mã website.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.72cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Các tệp dữ liệu mở tải về được chỉ là một dạng dữ liệu trên Web. Nhiều dữ liệu hơn vẫn là ẩn trong mã website.</div>

<h1 class="western" style="margin-left: -0.01cm; text-align: justify;">Tìm kiếm dữ liệu ẩn</h1>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Không phải tất cả dữ liệu là sẵn sàng để tải về. Thường thì nó là ẩn trên các website khác nhau mà chúng ta viếng thăm mỗi ngày.</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.41cm; margin-left: -0.01cm; text-align: justify;"><span style="font-size: medium;"><b>Vì sao dữ liệu ẩn?</b></span></div>

<div align="center" class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm;">
<div class="separator" style="clear:both; text-align:center"><a href="https://1.bp.blogspot.com/-sx6jBct36bA/XnPuHzp9BhI/AAAAAAAARfU/J9_vmgNmQAYDpdIyj-FpjjEDvDWhcMLVACLcBGAsYHQ/s1600/odi-002.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img alt="" border="0" data-original-height="370" data-original-width="550" height="430" src="https://1.bp.blogspot.com/-sx6jBct36bA/XnPuHzp9BhI/AAAAAAAARfU/J9_vmgNmQAYDpdIyj-FpjjEDvDWhcMLVACLcBGAsYHQ/s640/odi-002.jpg" width="640" /></a></div>
</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Sự dịch chuyển hướng tới Web do dữ liệu dẫn dắt, do di động xúc tác đã dẫn tới sự thay đổi trong cách các website được xây dựng. Để đáp ứng được các kỳ vọng của người sử dụng về các website tương tác, trực quan, các lập trình viên ngày càng đặt dữ liệu vào ‘lớp’ tách biệt hoặc thậm chí vào bản thân mã. Lớp dữ liệu này thường truy cập được tới những người bằng việc sử dụng các công cụ đúng.</div>

<h2 class="western" style="margin-left: -0.01cm; text-align: justify;">Dữ liệu là ẩn ở khắp mọi nơi</h2>

<div align="center" class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm;">&nbsp;
<div class="separator" style="clear:both; text-align:center"><a href="https://1.bp.blogspot.com/-S18lQjPbOMQ/XnPuS75Z7TI/AAAAAAAARfc/nDuoo4RPjggXeHeExfKV-LShGDDYykXsQCLcBGAsYHQ/s1600/odi-003.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img alt="" border="0" data-original-height="370" data-original-width="550" height="430" src="https://1.bp.blogspot.com/-S18lQjPbOMQ/XnPuS75Z7TI/AAAAAAAARfc/nDuoo4RPjggXeHeExfKV-LShGDDYykXsQCLcBGAsYHQ/s640/odi-003.jpg" width="640" /></a></div>
</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Từ các trang Wikipedia tới các nhà lập kế hoạch cho các kỳ nghỉ, các website thời trang cho tới các nhà cung cấp năng lượng, Web là đầy các nguồn dữ liệu.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Các giấy phép cho các dữ liệu ẩn này không luôn là rõ ràng; chỉ vì dữ liệu là máy đọc được trên một website công cộng không làm cho nó trở thành dữ liệu mở. Nếu bạn không chắc chắn về việc liệu các dữ liệu ẩn đó có được cấp phép mở hay không, hãy kiểm tra với nhà xuất bản website đó.</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.41cm; margin-left: -0.01cm; text-align: justify;"><span style="font-size: medium;"><b>Dạng dữ liệu nào là ẩn?</b></span></div>

<div align="center" class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm;">
<div class="separator" style="clear:both; text-align:center"><a href="https://1.bp.blogspot.com/-hyLPu90CMH4/XnPuc0EZ8mI/AAAAAAAARfk/lq8haCGUTHQt4sI8PXVNI23dveaKbpkJACLcBGAsYHQ/s1600/odi-004.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img alt="" border="0" data-original-height="370" data-original-width="550" height="430" src="https://1.bp.blogspot.com/-hyLPu90CMH4/XnPuc0EZ8mI/AAAAAAAARfk/lq8haCGUTHQt4sI8PXVNI23dveaKbpkJACLcBGAsYHQ/s640/odi-004.jpg" width="640" /></a></div>
</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Dữ liệu ẩn trông hoàn toàn khác với tập hợp dữ liệu mở bạn tải về từ website.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Dữ liệu máy đọc được trên Web sẽ ở trong các định dạng như JSON - định dạng phổ biến và đơn giản nhất để sử dụng - được nhúng vào HTML, trong XML và đôi khi trong RDF.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.72cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Hãy thử các bài tập sau này trong bài này để thấy liệu bạn có thể trích dữ liệu ra trong các định dạng đó hay không.</div>

<h1 class="western" style="margin-bottom: 0.39cm; margin-left: -0.01cm; text-align: justify;">Những lợi ích của dữ liệu ẩn</h1>

<h2 class="western" style="margin-left: -0.01cm; text-align: justify;">Chất lượng</h2>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;"><span style="color: black;"><span style="font-size: small;">Trong nhiều trường hợp dữ liệu ẩn sẽ là dữ liệu được nhà xuất bản sử dụng để trình bày trang web bạn đang xem trên trang của họ.</span></span></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;"><span style="color: black;"><span style="font-size: small;">Dữ liệu ẩn vì thế là phần quan trọng trong các hoạt động trên trực tuyến của chúng và có khả năng nhà xuất bản đó quan tâm chăm sốc chất lượng của nó.</span></span></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;"><span style="color: black;"><span style="font-size: small;">Dữ liệu được trích ra từ Web có xu hướng tin cậy hơn vì có khả năng đó là dữ liệu trong cốt lõi các hoạt động của một tổ chức. Vì thế, có nhiều khả năng hơn đó là nguồn dữ liệu dựa vào đó để làm việc</span></span>.</div>

<h2 class="western" style="margin-left: -0.01cm; text-align: justify;">Thích hợp</h2>

<div class="western" style="line-height: 110%; margin-bottom: 0cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Các tổ chức không luôn xuất bản dữ liệu tải về được. Tuy nhiên, nhiều trong số họ quản lý các website do dữ liệu dẫn dắt. Bằng việc truy cập dữ liệu trực tiếp thông qua bộ cấp dữ liệu (data feeds) (hoặc từ bên trong mã website đó) có sự sử dụng rõ ràng dữ liệu đó rồi. Điều này sẽ giúp bạn nhanh chóng xác định dữ liệu thích hợp từ sử dụng đang có đó, thay vì tự mình phải thiết lập sự sử dụng đó. Ví dụ, các trang tin của BBC, các phần và các bộ cấp dữ liệu có liên quan.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; text-align: justify;"><span style="color: rgb(0, 0, 238);"><u><a href="http://www.bbc.co.uk/news/10628494"><span style="color: rgb(0, 0, 238);">Xem các bộ cấp tin tức của BBC</span></a></u></span></div>

<h2 class="western" style="margin-left: -0.01cm; text-align: justify;">Ngữ cảnh</h2>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Khi bạn truy cập dữ liệu trực tiếp từ Web, bạn đang xem rồi nó theo ngữ cảnh nó được sử dụng theo nhà xuất bản đó. Như chúng tôi đã đề cập tới trong các bài trước, ngữ cảnh của dữ liệu là thành phần quan trọng của sự sử dụng nó.</div>

<h2 class="western" style="margin-left: -0.01cm; text-align: justify;">Độ rộng</h2>

<div class="western" style="line-height: 110%; margin-bottom: 0.72cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Thường thì tổ chức bị giới hạn trng một lượng dữ liệu nó có thể xuất bản như là dữ liệu tải về được. Việc tìm kiếm dữ liệu ẩn mở ra dải rộng lớn hơn các tài nguyên.</div>

<h1 class="western" style="margin-left: -0.01cm; text-align: justify;">Tìm kiếm dữ liệu ẩn như thế nào</h1>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Từ dữ liệu chúng ta có được thông tin, từ thông tin chúng ta có được tri thức và sự thấu hiểu.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Xin lưu ý là thực tế bạn có thể trích ra dữ liệu ẩn không làm cho dữ liệu đó thành mở. Bạn luôn nên kiểm tra các điều khoản sử dụng của website và các giấy phép trước khi thu thập hoặc sử dụng dữ liệu vì bất kỳ mục đích gì. Để có thêm thông tin về việc cấp phép, vui lòng tham chiếu ngược về bài 4 của khóa học này.</div>

<h2 class="western" style="margin-bottom: 0cm; margin-left: -0.01cm; text-align: justify;">Phần mở rộng tải về</h2>

<div align="center" class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm;">&nbsp;
<div class="separator" style="clear:both; text-align:center"><a href="https://1.bp.blogspot.com/-Ae5MAYgQVz0/XnPuoZepNOI/AAAAAAAARfs/mmNXIrFLSIgQy46fh0YWlOpYec_oH3aHQCLcBGAsYHQ/s1600/odi-006.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img alt="" border="0" data-original-height="370" data-original-width="550" height="430" src="https://1.bp.blogspot.com/-Ae5MAYgQVz0/XnPuoZepNOI/AAAAAAAARfs/mmNXIrFLSIgQy46fh0YWlOpYec_oH3aHQCLcBGAsYHQ/s640/odi-006.jpg" width="640" /></a></div>
</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Vài website đã được xây dựng để chào cách thức trích xuất dữ liệu bằng cách bổ sung thêm phần mở rộng vào URL của trang web bạn đang xem. Các website như vậy thường được các tổ chức duy trì và họ cũng xuất bản dữ liệu mở tải về được, với việc bổ sung thêm phần mở rộng đúng sẽ kích hoạt bản tải về trang đó ở định dạng dữ liệu, đối nghịch với định dạng của trình duyệt.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Ví dụ tốt về điều này là website của chính phủ Vương quốc Anh (gov.uk), nó cung cấp cho bất kỳ trang nào ở định dạng dữ liệu đơn giản bằng việc bổ sung thêm mở rộng thích hợp như “.json”, ví dụ như www.gov.uk/browse/business.json.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Hãy thử nó với dữ liệu thương mại của Vương quốc Anh bằng việc xem trang sau đây và sau đó thêm “.json” để có được dữ liệu đó.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; text-align: justify;"><span style="color: rgb(0, 0, 238);"><u><a href="https://www.gov.uk/trade-tariff/sections"><span style="color: rgb(0, 0, 238);">Xem trang về thuế thương mại của Vương quốc Anh</span></a></u></span></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Để xem dữ liệu ở dạng người đọc được nhiều hơn, hãy sao chép nó vào jsonlint.com.</div>

<h2 class="western" style="margin-left: -0.01cm; text-align: justify;">Các bộ cấp dữ liệu (Data feeds)</h2>

<div align="center" class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm;">
<div class="separator" style="clear:both; text-align:center"><a href="https://1.bp.blogspot.com/-KfJixKsf-JM/XnPuwJl1ikI/AAAAAAAARfw/9KkeSqmlETYR4l68Zp0_wnYSROeBr_dLwCLcBGAsYHQ/s1600/odi-007.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img alt="" border="0" data-original-height="370" data-original-width="550" height="430" src="https://1.bp.blogspot.com/-KfJixKsf-JM/XnPuwJl1ikI/AAAAAAAARfw/9KkeSqmlETYR4l68Zp0_wnYSROeBr_dLwCLcBGAsYHQ/s640/odi-007.jpg" width="640" /></a></div>
</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Nhiều website cung cấp các đường liên kết tới các bộ cấp tổng hợp dữ liệu mà có thể đăng ký tới nó.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Các bộ cấp đó có thể là các bộ cấp RSS, các bộ cấp cảnh báo của Twitter hoặc các dạng ít phổ biến hơn khác. Các bộ cấp có thể được sử dụng để lấy dữ liệu thô về sự lựa chọn nội dung rộng lớn.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Ví dụ bộ cấp dữ liệu thô, xem bộ cấp tin tức của BBC trong XML.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; text-align: justify;"><span style="color: rgb(0, 0, 238);"><u><a href="http://feeds.bbci.co.uk/news/rss.xml"><span style="color: rgb(0, 0, 238);">Vì sao không thử bộ cấp tin tức từ BBC trong XML?</span></a></u></span></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 7.21cm; text-align: justify;">Bây giờ bạn có thể sử dụng công cụ tự do trên trực tuyến để làm cho dữ liệu đó dễ dàng hơn để sử dụng</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 7.21cm; text-align: justify;"><span style="color: rgb(0, 0, 238);"><u><a href="http://codebeautify.org/xmlviewer"><span style="color: rgb(0, 0, 238);">Hãy đi tới codebeautify và nhập vào URL của bộ cấp của BBC bên dưới &#039;Load URL&#039;</span></a></u></span></div>

<div class="western" style="line-height: 110%; margin-bottom: 0cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">hoặc có các cảnh báo về việc ngập tràn từ con sông gần bạn nhất (chỉ ở Vương quốc Anh).</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; text-align: justify;"><span style="color: rgb(0, 0, 238);"><u><a href="http://www.gaugemap.co.uk/"><span style="color: rgb(0, 0, 238);">Xem các đo mức nước sông</span></a></u></span></div>

<h2 class="western" style="margin-left: -0.01cm; text-align: justify;">Mã nguồn</h2>

<div align="center" class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm;">
<div class="separator" style="clear:both; text-align:center"><a href="https://1.bp.blogspot.com/-GBn0eMd_3wE/XnPu2eu9k1I/AAAAAAAARf4/aCzBs_N8dukvtox1KqNKyxGFUE0TI75IgCLcBGAsYHQ/s1600/odi-008.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img alt="" border="0" data-original-height="370" data-original-width="550" height="430" src="https://1.bp.blogspot.com/-GBn0eMd_3wE/XnPu2eu9k1I/AAAAAAAARf4/aCzBs_N8dukvtox1KqNKyxGFUE0TI75IgCLcBGAsYHQ/s640/odi-008.jpg" width="640" /></a></div>
</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Đi vượt ra khỏi việc cung cấp con đường đơn giản dẫn tới dữ liệu, nhiều trang có dữ liệu được nhúng vào mã nguồn của trang web đó.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Vì sao không kiểm tra công cụ ‘Hidden Data Extractor’ (Bộ Trích xuất Dữ liệu Ẩn) thí điểm của ODI để tìm ra mã nguồn nhỉ?</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.56cm; margin-left: -0.01cm; text-align: justify;"><span style="color: rgb(0, 0, 238);"><u><a href="http://odinprac.theodi.org/hidden-data-extractor/"><span style="color: rgb(0, 0, 238);">Xem bộ Trích xuất Dữ liệu Ẩn của ODI</span></a></u></span></div>

<h2 class="western" style="margin-left: -0.01cm; text-align: justify;">Các API hoặc các giao diện máy đọc được</h2>

<div align="center" class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm;">
<div class="separator" style="clear:both; text-align:center"><a href="https://1.bp.blogspot.com/-MvxhHG35JmU/XnPvBXJ1DBI/AAAAAAAARgE/MwOubEUxDC8gWIGVFaNPhZMiuudUun6UwCLcBGAsYHQ/s1600/odi-009.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img alt="" border="0" data-original-height="370" data-original-width="550" height="430" src="https://1.bp.blogspot.com/-MvxhHG35JmU/XnPvBXJ1DBI/AAAAAAAARgE/MwOubEUxDC8gWIGVFaNPhZMiuudUun6UwCLcBGAsYHQ/s640/odi-009.jpg" width="640" /></a></div>
</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Vài website hoặc dịch vụ Web sẽ hé lộ giao diện máy đọc được, hoặc API, cho việc truy vấn và truy cập dữ liệu của chúng.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Các ví dụ về các dịch vụ có các API gồm: <span style="color: rgb(0, 0, 238);"><u><a href="https://api.opencorporates.com/"><span style="color: rgb(0, 0, 238);">Open Corporates</span></a></u></span> (mở), <span style="color: rgb(0, 0, 238);"><u><a href="http://wiki.openstreetmap.org/wiki/API"><span style="color: rgb(0, 0, 238);">OpenSteetMap</span></a></u></span> (mở), <span style="color: rgb(0, 0, 238);"><u><a href="https://dev.twitter.com/rest/public"><span style="color: rgb(0, 0, 238);">Twitter</span></a></u></span> (không hoàn toàn mở), <span style="color: rgb(0, 0, 238);"><u><a href="https://www.flickr.com/services/api/"><span style="color: rgb(0, 0, 238);">Flickr</span></a></u></span> (một số nội dung mở), <span style="color: rgb(0, 0, 238);"><u><a href="https://developer.linkedin.com/docs/rest-api"><span style="color: rgb(0, 0, 238);">LinkedIn</span></a></u></span> (không mở).</div>

<div class="western" style="line-height: 110%; margin-bottom: 0cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Hầu hết các dịch vụ đó sử dụng API dựa vào Web và cho phép bổ sung các phần mở rộng (hãy thử “.json” trong OpenCorporates). Dù API này trông y hệt như ví dụ trước đó trong phần này, trạng thái chính thức của nó như là API cung cấp sự đảm bảo rằng dịch vụ đó sẽ là sẵn sàng.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">&nbsp;</div>

<h2 class="western" style="margin-left: -0.01cm; text-align: justify;">Quét Web</h2>

<div align="center" class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm;">
<div class="separator" style="clear:both; text-align:center"><a href="https://1.bp.blogspot.com/-nx_LzM4GW5w/XnPvHhYOMNI/AAAAAAAARgI/FENRSrWW3r8bQJqWqatFDriAAvtm0UX8gCLcBGAsYHQ/s1600/odi-010.jpg" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><img alt="" border="0" data-original-height="370" data-original-width="550" height="430" src="https://1.bp.blogspot.com/-nx_LzM4GW5w/XnPvHhYOMNI/AAAAAAAARgI/FENRSrWW3r8bQJqWqatFDriAAvtm0UX8gCLcBGAsYHQ/s640/odi-010.jpg" width="640" /></a></div>
</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Nếu không kỹ thuật nào làm việc, bạn có thể cần quét các trang web người đọc được. Trong khi điều này có thể là tin cậy, có rủi ro sự trình bày thay đổi cũng như nội dung thay đổi.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.72cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Vì sao không thử <span style="color: rgb(0, 0, 238);"><u><a href="http://magic.import.io/"><span style="color: rgb(0, 0, 238);">magic.import.io</span></a></u></span> để thấy nó có thể dễ dàng như thế nào?</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.31cm; margin-left: -0.01cm; text-align: justify;"><span style="font-size: large;"><b>Bạn sẵn sàng tìm kiếm dữ liệu ẩn?</b></span></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.72cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Bạn có thể nhớ lại những điều chính về dữ liệu ẩn?</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.31cm; margin-left: -0.01cm; text-align: justify;"><span style="font-size: large;"><b>Dữ liệu ẩn là gì?</b></span></div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Dữ liệu ẩn là...</b></div>

<ul style="text-align: justify;">
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0.42cm;">một phần của săn tìm kho báu</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0.42cm;">dữ liệu nhìn thấy được đối với máy nhưng không nhìn thấy đối với mắt người</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0.42cm;">các tệp khó tải về được</div>
	</li>
</ul>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: 0.64cm; margin-right: 9.44cm; text-align: justify;"><br  />
&nbsp;</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Đáp án đúng!</b></div>

<div class="western" style="line-height: 145%; margin-bottom: 0.22cm; margin-left: -0.01cm; margin-right: 0.44cm; text-align: justify;">Dữ liệu ẩn là dữ liệu con người không nhìn thấy được khi họ điều hướng Web nhưng máy lại có thể dễ dàng tìm thấy và hiểu được</div>

<div class="western" style="line-height: 145%; margin-bottom: 0.22cm; margin-left: -0.01cm; margin-right: 0.44cm; text-align: justify;"><b>Bạn chắc chắn chứ?</b></div>

<div class="western" style="line-height: 145%; margin-bottom: 0.22cm; margin-left: -0.01cm; margin-right: 0.44cm; text-align: justify;">Dữ liệu ẩn là dữ liệu con người không nhìn thấy được khi họ điều hướng Web nhưng máy lại có thể dễ dàng tìm thấy và hiểu được</div>

<div class="western" style="line-height: 145%; margin-bottom: 0.22cm; margin-left: -0.01cm; margin-right: 0.44cm; text-align: justify;"><br  />
&nbsp;</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.31cm; margin-left: -0.01cm; text-align: justify;"><span style="font-size: large;"><b>Vì sao lại là dữ liệu ẩn?</b></span></div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Mọi người ẩn dữ liệu đi vì...</b></div>

<ul style="text-align: justify;">
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0.42cm;">họ xấu hổ vì nó</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0.42cm;">đó là mớ lộn xộn</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0.42cm;">hầu hết thời gian họ cố tình không phơi lộ nó</div>
	</li>
</ul>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: 0.64cm; margin-right: 9.45cm; text-align: justify;"><br  />
&nbsp;</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Đáp án đúng!</b></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Hầu hết dữ liệu ẩn là được/bị ẩn đi một cách không cố ý. Thường thì một tổ chức xaayd ựng website đang tập trung vào cách để con người điều hướng các trang và vì thế không nghĩ về cách để dữ liệu được cung cấp.</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Bạn chắc chắn chứ?</b></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.72cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Hầu hết dữ liệu ẩn là được/bị ẩn đi một cách không cố ý. Thường thì một tổ chức xaayd ựng website đang tập trung vào cách để con người điều hướng các trang và vì thế không nghĩ về cách để dữ liệu được cung cấp.</div>

<h1 class="western" style="margin-left: -0.01cm; text-align: justify;">Những lợi ích của dữ liệu ẩn</h1>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Cái gì sau đây không là lợi ích của dữ liệu ẩn?</b></div>

<ul style="text-align: justify;">
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Độ rộng</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Chất lượng</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Khả năng đọc được</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Sự thích đáng</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Ngữ cảnh</div>
	</li>
</ul>

<div class="western" style="line-height: 110%; margin-bottom: 0cm; margin-left: 0.64cm; margin-right: 0.01cm; text-align: justify;">&nbsp;</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Đáp án đúng!</b></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Dữ liệu ẩn có thể làm gia tăng sự thích đáng và chất lượng của dữ liệu, độ rộng sẵn sàng và nhấn mạnh ngữ cảnh ở đó dữ liệu đó được sử dụng.</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Bạn chắc chắn chứ?</b></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.72cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Dữ liệu ẩn có thể làm gia tăng sự thích đáng và chất lượng của dữ liệu, độ rộng sẵn sàng và nhấn mạnh ngữ cảnh ở đó dữ liệu đó được sử dụng.</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.31cm; margin-left: -0.01cm; text-align: justify;"><span style="font-size: large;"><b>Bạn có thể trích ra dữ liệu ẩn như thế nào từ website?</b></span></div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Cái gì sau đây là cách hữu dụng để trích ra dữ liệu ẩn từ website?</b></div>

<ul style="text-align: justify;">
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Đưa vào bộ nhớ đệm đường liên kết của website</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Tải lại trang đó</div>
	</li>
	<li>
	<div class="western" style="line-height: 110%; margin-bottom: 0cm;">Kiểm tra mã nguồn</div>
	</li>
</ul>

<div class="western" style="line-height: 110%; margin-bottom: 0cm; margin-left: 0.64cm; margin-right: 0.01cm; text-align: justify;">&nbsp;</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Đáp án đúng!</b></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Việc kiểm tra mã nguồn của website thường hé lộ dữ liệu ẩn được nhúng trong trang đó.</div>

<div class="western" style="line-height: 108%; margin-bottom: 0.43cm; margin-left: -0.01cm; text-align: justify;"><b>Bạn chắc chắn chứ?</b></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.72cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Việc kiểm tra mã nguồn của website thường hé lộ dữ liệu ẩn được nhúng trong trang đó.</div>

<h1 class="western" style="margin-left: -0.01cm; text-align: justify;">Tìm kiếm dữ liệu ẩn trên Web</h1>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Dữ liệu sẵn sàng để tải về chỉ là một phần nhỏ của dữ liệu sẵn sàng trên Web.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Trong khi mắt người không phải luôn nhìn thấy dữ liệu, là có khả năng để nhận diện và nắm bắt được độ rộng của dữ liệu mới bằng việc sử dụng máy.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Dữ liệu truy cập được từ các website đó thường rộng lớn hơn và thích đáng hơn nhiều cho công việc của bạn so với các tệp tải về được và cũng được rút ra trực tiếp từ ngữ cảnh ở đó nhà xuất bản đang sử dụng nó rồi.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.01cm; text-align: justify;">Bằng việc nâng cao nhận thức về dữ liệu ẩn và học vài tiếp cận đơn giản trong bài này, như các truy vấn mở rộng và các API, bạn sẽ có khả năng truy cập được dải rộng lớn các dữ liệu thích đáng cho công việc trong tương lai của bạn.</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; text-align: justify;"><br  />
&nbsp;</div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.09cm; text-align: justify;"><a href="https://letrungnghia.mangvn.org/Education/bai-11-lam-sach-du-lieu-cua-ban-nhu-the-nao-6376.html">Về bài trước</a> ………. <a href="https://letrungnghia.mangvn.org/Education/bai-13-lien-ket-len-web-du-lieu-6378.html">Tới bài sau</a></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.09cm; text-align: justify;"><a href="https://letrungnghia.mangvn.org/Education/khoa-hoc-co-ban-ve-du-lieu-mo-trong-chuong-trinh-hoc-tap-dien-tu-tren-cong-du-lieu-chau-au-6383.html">Về mục lục</a></div>

<div class="western" style="line-height: 110%; margin-bottom: 0.42cm; margin-left: -0.01cm; margin-right: 0.09cm; text-align: justify;">Theo: <span style="color: navy;"><span lang="zxx"><u><a href="https://www.europeandataportal.eu/">https://www.europeandataportal.eu/</a></u></span></span> và <span style="color: navy;"><span lang="zxx"><u><a href="https://theodi.org/">https://theodi.org/</a></u></span></span></div>

<div class="western" style="text-align: justify;">Dịch: Lê Trung Nghĩa</div>

<div class="western" style="margin-bottom: 0.14cm; margin-left: -0.01cm; text-align: justify;"><span style="color: rgb(0, 0, 238);"><u>letrungnghia.foss@gmail.com</u></span></div>
</div>
		</div>
	</div>
	<div id="footer" class="clearfix">
		<div id="url">
			<strong>URL của bản tin này: </strong><a href="https://letrungnghia.mangvn.org/savefile/Education/bai-12-tim-kiem-du-lieu-an-tren-web-6377.html" title="Bài 12 - Tìm kiếm dữ liệu ẩn trên Web">https://letrungnghia.mangvn.org/savefile/Education/bai-12-tim-kiem-du-lieu-an-tren-web-6377.html</a>

		</div>
		<div class="clear"></div>
		<div class="copyright">
			&copy; Blog FOSS by Lê Trung Nghĩa
		</div>
		<div id="contact">
			<a href="mailto:webmaster@vinades.vn">webmaster@vinades.vn</a>
		</div>
	</div>
</div>
        <div id="timeoutsess" class="chromeframe">
            Bạn đã không sử dụng Site, <a onclick="timeoutsesscancel();" href="https://letrungnghia.mangvn.org/#">Bấm vào đây để duy trì trạng thái đăng nhập</a>. Thời gian chờ: <span id="secField"> 60 </span> giây
        </div>
        <div id="openidResult" class="nv-alert" style="display:none"></div>
        <div id="openidBt" data-result="" data-redirect=""></div>
<div id="run_cronjobs" style="visibility:hidden;display:none;"><img alt="cron" src="/index.php?second=cronjobs&amp;p=s5s0o4OR" width="1" height="1" /></div>
<script src="https://letrungnghia.mangvn.org/assets/js/jquery/jquery.min.js"></script>
<script>var nv_base_siteurl="/",nv_lang_data="vi",nv_lang_interface="vi",nv_name_variable="nv",nv_fc_variable="op",nv_lang_variable="language",nv_module_name="news",nv_func_name="savefile",nv_is_user=0, nv_my_ofs=7,nv_my_abbr="+07",nv_cookie_prefix="nv4c_Cgoz2",nv_check_pass_mstime=1738000,nv_area_admin=0,nv_safemode=0,theme_responsive=0,nv_recaptcha_ver=2,nv_recaptcha_sitekey="6LcNwC8UAAAAAMm8ZTYNygweLUQtOU0IapbDRk69",nv_recaptcha_type="image",XSSsanitize=1;</script>
<script src="https://letrungnghia.mangvn.org/assets/js/language/vi.js"></script>
<script src="https://letrungnghia.mangvn.org/assets/js/DOMPurify/purify3.js"></script>
<script src="https://letrungnghia.mangvn.org/assets/js/global.js"></script>
<script src="https://letrungnghia.mangvn.org/assets/js/site.js"></script>
<script src="https://letrungnghia.mangvn.org/themes/default/js/news.js"></script>
<script src="https://letrungnghia.mangvn.org/themes/default/js/main.js"></script>
<script src="https://letrungnghia.mangvn.org/themes/default/js/custom.js"></script>
<script type="application/ld+json">
        {
            "@context": "https://schema.org",
            "@type": "Organization",
            "url": "https://letrungnghia.mangvn.org",
            "logo": "https://letrungnghia.mangvn.org/uploads/letrungnghia/le-trung-nghia.png"
        }
        </script>
<script src="https://letrungnghia.mangvn.org/themes/default/js/bootstrap.min.js"></script>
</body>
</html>