<!DOCTYPE html>
    <html lang="vi" xmlns="http://www.w3.org/1999/xhtml" prefix="og: http://ogp.me/ns#">
    <head>
<title>Dữ liệu để phân loại AI</title>
<meta name="description" content="Dữ liệu để phân loại AI - Savefile - Blogs - https&#x3A;&#x002F;&#x002F;letrungnghia.mangvn.org&#x002F;savefile&#x002F;Education&#x002F;du-lieu-de-phan-loai-ai-7603.html">
<meta name="author" content="Blog FOSS by Lê Trung Nghĩa">
<meta name="copyright" content="Blog FOSS by Lê Trung Nghĩa [webmaster@vinades.vn]">
<meta name="generator" content="NukeViet v4.5">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta property="og:title" content="Dữ liệu để phân loại AI">
<meta property="og:type" content="website">
<meta property="og:description" content="Savefile - Blogs - https&#x3A;&#x002F;&#x002F;letrungnghia.mangvn.org&#x002F;savefile&#x002F;Education&#x002F;du-lieu-de-phan-loai-ai-7603.html">
<meta property="og:site_name" content="Blog FOSS by Lê Trung Nghĩa">
<meta property="og:url" content="https://letrungnghia.mangvn.org/savefile/Education/du-lieu-de-phan-loai-ai-7603.html">
<link rel="shortcut icon" href="https://letrungnghia.mangvn.org/favicon.ico">
<link rel="canonical" href="https://letrungnghia.mangvn.org/savefile/Education/du-lieu-de-phan-loai-ai-7603.html">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/" title="Blogs" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Government/" title="Blogs - Government" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Policy/" title="Blogs - Policy" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Philosophy/" title="Blogs - Philosophy" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Security/" title="Blogs - Security" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Legal/" title="Blogs - Legal" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Education/" title="Blogs - Education" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Business/" title="Blogs - Business" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Community/" title="Blogs - Community" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Interoperability/" title="Blogs - Interoperability" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Standards/" title="Blogs - Standards" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Author/" title="Blogs - Author" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Opinions/" title="Blogs - Opinions" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/CC/" title="Blogs - CC" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Cloud/" title="Blogs - Cloud" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Hardware/" title="Blogs - Hardware" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Software/" title="Blogs - Software" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Statistics/" title="Blogs - Statistics" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Trends/" title="Blogs - Trends" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/China/" title="Blogs - China" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/OSs/" title="Blogs - OSs" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Blogs/" title="Blogs - Blogs" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/Outsourcing/" title="Blogs - Outsourcing" type="application/rss+xml">
<link rel="alternate" href="https://letrungnghia.mangvn.org/rss/elearning/" title="Blogs - Elearning" type="application/rss+xml">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/assets/css/font-awesome.min.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/bootstrap.non-responsive.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/style.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/style.non-responsive.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/news.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/themes/default/css/custom.css" type="text/css">
<link rel="preload" as="style" href="https://letrungnghia.mangvn.org/assets/css/default.vi.1106.css" type="text/css">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/jquery/jquery.min.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/language/vi.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/DOMPurify/purify3.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/global.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/assets/js/site.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/themes/default/js/news.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/themes/default/js/main.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/themes/default/js/custom.js" type="text/javascript">
<link rel="preload" as="script" href="https://letrungnghia.mangvn.org/themes/default/js/bootstrap.min.js" type="text/javascript">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/assets/css/font-awesome.min.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/themes/default/css/bootstrap.non-responsive.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/themes/default/css/style.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/themes/default/css/style.non-responsive.css">
<link rel="StyleSheet" href="https://letrungnghia.mangvn.org/themes/default/css/news.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/themes/default/css/custom.css">
<link rel="stylesheet" href="https://letrungnghia.mangvn.org/assets/css/default.vi.1106.css">
<style type="text/css">
	body{background: #fff;}
</style>
<script>(function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){
(i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),
m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)
})(window,document,'script','https://www.google-analytics.com/analytics.js','ga');
ga('create', 'UA-70254229-3', '');
ga('send', 'pageview');
</script>
</head>
    <body>
<div id="print">
	<div id="hd_print">
		<h2 class="pull-left">Blog FOSS by Lê Trung Nghĩa</h2>
		<p class="pull-right"><a title="Blog FOSS by Lê Trung Nghĩa" href="https://letrungnghia.mangvn.org/">https://letrungnghia.mangvn.org</a></p>
	</div>
	<div class="clear"></div>
	<hr />
	<div id="content">
		<h1>Dữ liệu để phân loại AI</h1>
		<ul class="list-inline">
			<li>Thứ tư - 19/02/2025 06:50</li>
			<li class="hidden-print txtrequired"><em class="fa fa-print">&nbsp;</em><a title="In ra" href="javascript:;" onclick="window.print()">In ra</a></li>
			<li class="hidden-print txtrequired"><em class="fa fa-power-off">&nbsp;</em><a title="Đóng cửa sổ này" href="javascript:;" onclick="window.close()">Đóng cửa sổ này</a></li>
		</ul>
		<div class="clear"></div>
		<div id="hometext">
		</div>
				<div class="imghome">
			<img alt="Dữ liệu để phân loại AI" src="https://letrungnghia.mangvn.org/uploads/letrungnghia/news/2025/odi_ai.png" width="460" class="img-thumbnail" />
		</div>
		<div class="clear"></div>
		<div id="bodytext" class="clearfix">
			<p align="justify"><b><span style="background: rgb(255, 255, 0);">A data for AI taxonomy</span></b></p>

<p align="justify">Tue Oct 15, 2024</p>

<p align="justify">Theo: <a href="https://theodi.org/news-and-events/blog/a-data-for-ai-taxonomy/">https://theodi.org/news-and-events/blog/a-data-for-ai-taxonomy/</a></p>

<p align="justify">Bài được đưa lên Internet ngày: 15/10/2024</p>

<p align="justify">Chúng tôi đã phát triển sự phân loại dữ liệu có liên quan đến việc phát triển, sử dụng và giám sát các mô hình và hệ thống AI nền tảng. </p>

<p align="justify">Các hệ thống trí tuệ nhân tạo (AI) hiện đại được đặc trưng bởi các mô hình phạm vi rộng và tính linh hoạt cao, có khả năng sản sinh ra các kết quả đầu ra phong phú. </p>

<p align="justify">Nhận biết cả tiềm năng và <span style="font-weight: normal">rủi ro của các mô hình mới đó, Viện Dữ liệu Mở </span>- ODI (Open Data Institute) đã bắt tay vào <a href="https://theodi.org/insights/projects/data-centric-ai/">một </a><a href="https://theodi.org/insights/projects/data-centric-ai/">chương trình công việc về AI lấy dữ liệu làm trung tâm</a> (Data-centric AI), được thiết kế để mang lại một hệ sinh thái AI dựa trên các thực hành dữ liệu có trách nhiệm. </p>

<p align="justify"><span style="background: transparent">Như một phần của công việc này, chúng tôi đã bắt đầu phát triển sự phân loại dữ liệu có liên quan đến việc phát triển, sử dụng và giám sát các mô hình và hệ thống AI nền tảng. Đây là phản hồi cho cách dữ liệu được sử dụng để đào tạo các mô hình thường được mô tả như là một khối tĩnh, đơn lẻ và để chứng minh nhiều loại dữ liệu cần thiết để xây dựng, sử dụng và giám sát các hệ thống AI một cách an toàn và hiệu quả.</span></p>

<p align="justify"><span style="background: transparent">Cũng như việc sử dụng nó trong công việc của riêng chúng tôi, chúng tôi hy vọng phân loại này sẽ được những người khác sử dụng - đặc biệt các nhà nghiên cứu và các nhà hoạch định chính sách.</span> Chúng tôi nghĩ nó sẽ bổ sung thêm sắc thái trong các cuộc tranh luận về dữ liệu cho AI, bao gồm ở những nơi quyền truy cập công bằng tới dữ liệu là rất cần thiết trong tương lai, liệu các nhà phát triển có thực sự sắp &quot;hết dữ liệu&quot; hay không và tập dữ liệu AI nào rất quan trọng đối với hệ sinh thái AI và do đó đòi hỏi sự quản lý đặc biệt chu đáo.</p>

<p align="justify">Dù được thiết kế để phản ánh dữ liệu có liên quan trong các mô hình lớn, nền tảng, chúng tôi nghi ngờ rằng phần lớn phân loại này cũng có thể áp dụng cho các mô hình nhỏ hơn và hẹp hơn.</p>

<p align="justify"><a href="https://theodi.org/documents/519/A_taxonomy_of_the_data_involved_in_developing_using_and_monitoring_AI_systems.pdf">Tải về phân loại</a> (<a href="https://www.dropbox.com/scl/fi/g9rk3sxv0sgd8rlngg306/A_taxonomy_of_the_data_involved_in_developing_using_and_monitoring_AI_systems_Vi-18012025.pdf?rlkey=81i4gw8l2vdooyzipn7kxxrli&amp;st=bhzf5if8&amp;dl=0">bản dịch sang tiếng Việt</a>)</p>

<p align="justify"><span style="background: rgb(255, 255, 0);">We&#039;ve developed a taxonomy of the data involved in developing, using and monitoring foundation AI models and systems.</span></p>

<p align="justify"><span style="background: rgb(255, 255, 0);">Modern artificial intelligence (AI) systems are characterised by models of large scale and high flexibility, capable of producing rich outputs.</span></p>

<p align="justify"><span style="background: rgb(255, 255, 0);">Recognising both the potential and the risks of these new models, the Open Data Institute has embarked on </span><a href="https://theodi.org/insights/projects/data-centric-ai/"><u><span style="background: rgb(255, 255, 0);">a programme of work on data-centric AI</span></u></a><span style="background: rgb(255, 255, 0);">, designed to bring about an AI ecosystem grounded in responsible data practices.</span></p>

<p align="justify"><span style="background: rgb(255, 255, 0);">As part of this work, we set out to develop a taxonomy of the data involved in developing, using and monitoring foundation AI models and systems. It is a response to the way that the data used to train models is often described as if a static, singular blob, and to demonstrate the many types of data needed to build, use and monitor AI systems safely and effectively.</span></p>

<p align="justify"><span style="background: rgb(255, 255, 0);">As well as using it in our own work, we hope for this taxonomy to be used by others - especially researchers and policymakers. We think it will add nuance in ongoing debates in data for AI, including where equitable access to data is badly needed going forward, whether developers are really about to ‘run out of data’, and which AI datasets are critical to the AI ecosystem and therefore require particularly thoughtful stewardship.</span></p>

<p align="justify"><span style="background: rgb(255, 255, 0);">Although designed to reflect the data involved in large, foundation models, we suspect much of the taxonomy will also apply to smaller, narrower models too.</span></p>

<p align="justify"><a href="https://theodi.org/documents/519/A_taxonomy_of_the_data_involved_in_developing_using_and_monitoring_AI_systems.pdf"><span style="background: rgb(255, 255, 0);">Download the taxonomy</span></a></p>

<p align="justify">Dịch: Lê Trung Nghĩa </p>

<p align="justify">letrungnghia.foss@gmail.com </p>
		</div>
				<div id="author">
						<p>
				<strong>Tác giả:</strong>
				<a href="https://letrungnghia.mangvn.org/author/Nghia-Le-Trung/">Nghĩa Lê Trung</a>
			</p>
		</div>
	</div>
	<div id="footer" class="clearfix">
		<div id="url">
			<strong>URL của bản tin này: </strong><a href="https://letrungnghia.mangvn.org/savefile/Education/du-lieu-de-phan-loai-ai-7603.html" title="Dữ liệu để phân loại AI">https://letrungnghia.mangvn.org/savefile/Education/du-lieu-de-phan-loai-ai-7603.html</a>

		</div>
		<div class="clear"></div>
		<div class="copyright">
			&copy; Blog FOSS by Lê Trung Nghĩa
		</div>
		<div id="contact">
			<a href="mailto:webmaster@vinades.vn">webmaster@vinades.vn</a>
		</div>
	</div>
</div>
        <div id="timeoutsess" class="chromeframe">
            Bạn đã không sử dụng Site, <a onclick="timeoutsesscancel();" href="https://letrungnghia.mangvn.org/#">Bấm vào đây để duy trì trạng thái đăng nhập</a>. Thời gian chờ: <span id="secField"> 60 </span> giây
        </div>
        <div id="openidResult" class="nv-alert" style="display:none"></div>
        <div id="openidBt" data-result="" data-redirect=""></div>
<div id="run_cronjobs" style="visibility:hidden;display:none;"><img alt="cron" src="/index.php?second=cronjobs&amp;p=m8t2Knju" width="1" height="1" /></div>
<script src="https://letrungnghia.mangvn.org/assets/js/jquery/jquery.min.js"></script>
<script>var nv_base_siteurl="/",nv_lang_data="vi",nv_lang_interface="vi",nv_name_variable="nv",nv_fc_variable="op",nv_lang_variable="language",nv_module_name="news",nv_func_name="savefile",nv_is_user=0, nv_my_ofs=7,nv_my_abbr="+07",nv_cookie_prefix="nv4c_Cgoz2",nv_check_pass_mstime=1738000,nv_area_admin=0,nv_safemode=0,theme_responsive=0,nv_recaptcha_ver=2,nv_recaptcha_sitekey="6LcNwC8UAAAAAMm8ZTYNygweLUQtOU0IapbDRk69",nv_recaptcha_type="image",XSSsanitize=1;</script>
<script src="https://letrungnghia.mangvn.org/assets/js/language/vi.js"></script>
<script src="https://letrungnghia.mangvn.org/assets/js/DOMPurify/purify3.js"></script>
<script src="https://letrungnghia.mangvn.org/assets/js/global.js"></script>
<script src="https://letrungnghia.mangvn.org/assets/js/site.js"></script>
<script src="https://letrungnghia.mangvn.org/themes/default/js/news.js"></script>
<script src="https://letrungnghia.mangvn.org/themes/default/js/main.js"></script>
<script src="https://letrungnghia.mangvn.org/themes/default/js/custom.js"></script>
<script type="application/ld+json">
        {
            "@context": "https://schema.org",
            "@type": "Organization",
            "url": "https://letrungnghia.mangvn.org",
            "logo": "https://letrungnghia.mangvn.org/uploads/letrungnghia/le-trung-nghia.png"
        }
        </script>
<script src="https://letrungnghia.mangvn.org/themes/default/js/bootstrap.min.js"></script>
</body>
</html>