Thách thức Accumulo, Phần I

Thứ tư - 01/08/2012 06:00
TheAccumulo Challenge, Part I

June 18, 2012

Theo:http://atechnologyjobisnoexcuse.com/2012/06/the-accumulo-challenge-part-i/

Bài được đưa lênInternet ngày: 18/06/2012

Lờingười dịch: Khi các cơ quan nhà nước tham gia phát triểncác dự án nguồn mở, nếu làm không đúng, họ sẽbiến dự án đó thành một bản rẽ nhánh của dự ánban đầu, gây đúp bản một cách không cần thiết và dẫmchân lên các công việc của giới công nghiệp, của cáccông ty, làm bóp méo thị trường. Sẽ là nguy hiểmhơn, nếu họ lại đưa ra các văn bản pháp qui đểbảo vệ cho những sai lầm đó. Bài viết này nói vềmột dự án nguồn mở như vậy tại Cơ quan An ninh Quốcgia Mỹ, NSA. Cũng từ vụ việc này, một loạt các câuhỏi đã được đặt ra, ví dụ như: “Liệu chính phủcó làm hại cho khu vực tư nhân khi họ phát hành các dựán nguồn mở hay không? Làm thế nào chúng ta có thể biếtkhi nào nguồn mở là một cách thức phù hợp cho chínhphủ để phát triển phần mềm? Làm thế nào chính phủđiều hành được các bản rẽ nhánh?”

Hàng tá các dự ánphần mềm được tung ra trong sự bừng tỉnh của các tàiliệu Big Table và Map Reduce của Google đã thay đổi cáchthức chúng ta điều khiển các tập hợp dữ liệu lớn.Giống như nhiều tổ chức, NSA đã bắt đầu trảinghiệm với các công cụ của “các dữ liệu lớn” vàđã nhận ra rằng những triển khai nguồn mở đang tồntại lúc này từng không đề cập tới một số nhu cầuđặc biệt của họ. Họ đã quyết định bắt tay vào dựán của riêng họ: Accumulo. Họ từng hạnh phúc với cácmà Accumulo làm việc, họ làm đúng thứ cần làm và đãđưa ra Accumulo cho thế giới thông qua Quỹ Apache.

Đây là thứ tuyệtvời cho nguồn mở và người đóng thuế. Chính phủ thấymột yêu ầu không được khu vực tư nhân làm thỏa mãn,và thay vì để công việc của họ phai tàn bên trong cácbức tường của mình, hoặc trả tiền cho một nhà thầuđể phát triển một giải pháp sở hữu độc quyền, họđã chia sẻ những gì họ đã có với thế giới. Đây lànhững gì những người bảo vệ nguồn mở đã từng kêugọi và với sáng kiến Chia sẻ Trước tiên (SharedFirst) tại Văn phòng Quản lý Ngân sách OMB và cácchính sách nguồn mở đổi mới như tại Văn phòng Bảovệ Tài chính Người tiêu dùng, thì đây chắc chắn làđiều chúng ta sẽ thấy nhiều hơn về dạng chia sẻ nàycủa công việc được những người đóng thuế cung cấptiền.

Dù đây là một mẻđánh bắt. Khi nó được tung ra, Accumulo đã tham gia vàomột không gian các công cụ của đám đông ngày một giatăng mà quản lý các dữ liệu lớn. Khi những người mớiphất đó cạnh tranh - bằng chứng và thành công lạthường của MongoDB từ các triển khai cài đặt của 10gen, Hadoop từ Cloudera và HortonWorks, các công cụ nhưHadapt, Hbase,Cassandra, MapR,và nhiều, nhiều dự án khác – Accumulo thể hiện mộtmối đe dọa. Một số trong những sản phẩm và dự ánđó cạnh tranh với nhau, và khu vực tư nhân không thíchnó khi chính phủ cạnh tranh cùng với họ, vì lý do tốt.

Thedozens of software projects launched in the wake of Google’s BigTable and MapReduce papers have changed the way we handle large datasets.Like many organizations, the NSA began experimenting with these “bigdata” tools and realized that the open source implementationsavailable at the time were not addressing some of theirparticular needs. They decided to embark on their ownproject: Accumulo.Once they were happy with how Accumulo was working, they did theright thing and released Accumulo to the world through the ApacheFoundation.

Thisis great for open source and the taxpayer. The government found arequirement not being fulfilled by the private sector, and ratherthan letting their work languish inside its walls, or paying acontractor to develop a proprietary solution, they shared what theyhad with the world. This is what open source advocates have beenclamoring for, and with the SharedFirst initiative at OMB and innovativeopen source policies like those at the ConsumerFinancial Protection Bureau, it’s certain we’ll see more ofthis kind of sharing of taxpayer-funded work.

There’sa catch, though. Since it was launched, Accumulo has joined anincreasingly crowded space for tools that manage big data. As theseupstarts compete – witness the extraordinary successof MongoDB f-rom 10genHadoop implementationsf-rom Cloudera and HortonWorks,tools like HadaptHBaseCassandraMapR,and many, many others – Accumulo presents a threat. Some of theseproducts and projects already compete with each other, and theprivate sector doesn’t like it when the government competesalongside them, for good reason.

There’sa frequently-ignored policy called OMBCircular A-130 which says that the government shouldn’tbuild something already available f-rom the private sector. In thelanguage of the policy, the government should:

…acquireoff-the-shelf software f-rom commercial sources, unless the costeffectiveness of developing custom software is clear and has beendocumented through pilot projects or prototypes

Sothere’s a tension here: we want the government to share itsinnovations, but we don’t want the government to crowd out theprivate sector. That’s the thinking behind this recent language inSection 929 of S.3254,the 2013 Defense Authorization as reported out by the Senate ArmedServices Committee:

Có một chính sáchthường xuyên bị bỏ qua gọi là Thông tư A-130 của OMBmà nói rằng chính phủ sẽ không xây dựng thứ gì đãcó sẵn rồi từ khu vực nhà nước. Theo ngôn từ củachính sách đó, chính phủ sẽ:

… mua sắm các phầnmềm sử dụng được ngay từ các nguồn thương mại, trừphi tính hiệu quả về chi phí của phần mềm tùy biếnđang phát triển là rõ ràng và đã được làm thành tàiliệu thông qua các dự án thí điểm hoặc các dự ánmẫu. Vì thế có sự căng thẳng ở đây: chúng ta muốnchính phủ chia sẻ đổi mới, nhưng chúng ta không muốnchính phủ đẩy khu vực tư nhân ra. Đó là tư duy đằngsau ngôn từ gần đây này trong Phần 929 của S.3254, Sựủy quyền Quốc phòng như được Ủy ban các Dịch vụ Vũtrang Thượng viện báo cáo.

(a) Hạn chế về Sửdụng Cơ sở dữ liệu của NSA -

(1) HẠN CHẾ - Khôngthành phần nào của Bộ Quốc phòng có thể sử dụng cơsở điện toán đám mây được Cơ quan An ninh Quốc gia(NSA) phát triển được gọi là Accumulo sau ngày 30/09/2013,trừ phi Giám đốc Thông tin của Bộ Quốc phòng chứngthực một trong những điều sau đây:

(A) Rằng không có cáccơ sở dữ liệu nguồn mở thương mại nào có khả năngtồn tại được với sự hỗ trợ tăng cường của giớicông nghiệp (như các cơ sở dữ liệu HBase và Cassandracủa Quỹ Linux) mà có các tính năng an ninh có khả năngso sánh được với cơ sở dữ liệu Accumulo được xem làcơ bản đối với Giám đốc Thông tin vì những mục đíchchứng thực theo đoạn này.

(B) Rằng cơ sở dữliệu Accumulo đã trở thành một cơ sở dữ liệu nguồnmở thành công của Quỹ Apache với sự hỗ trợ và đadạng hóa phù hợp của giới công nghiệp, dựa vào cáctiêu chí được Giám đốc Thông tin thiết lập cho nhữngmục đích chứng thực theo đoạn này và được đệtrình cho các ủy ban phù hợp của Nghị viện không muộnhơn ngày 01/01/2013.

(2) XÂY DỰNG - Hạnchế trong đoạn (1) sẽ không áp dụng cho NSA.

(b) Áp dụng các Tínhnăng An ninh của Accumulo cho Cơ sở dữ liệu HBase - Giámđốc NSA sẽ tiến hành những hành động phù hợp đểđảm bảo rằng các công ty và tổ chức phát triển vàhỗ trợ nguồn mở và các phiên bản nguồn mở thươngmại của các cơ sở dữ liệu HBase và Cassandra của QuỹApache, hoặc các hệ thống tương tự, nhận được sựhỗ trợ kỹ thuật từ chính phủ và các lập trình viêncủa các nhà thầu cho mã nguồn phần mềm đối với cơsở dữ liệu Accumulo để cho phép thích nghi và tích hợpcác tính năng an ninh của cơ sở dữ liệu Accumulo.

(a)Limitation on Use of NSA Database-

(1)LIMITATION- No component of the Department of Defense may utilize thecloud computing database developed by the National Security Agency(NSA) called Accumulo after September 30, 2013, unless the ChiefInformation Officer of the Department of Defense certifies one of thefollowing:

(A)That there are no viable commercial open source databases withextensive industry support (such as the Apache Foundation HBase andCassandra databases) that have security features comparable to theAccumulo database that are considered essential by the ChiefInformation Officer for purposes of the certification under thisparagraph.

(B)That the Accumulo database has become a successful Apache Foundationopen source database with adequate industry support anddiversification, based on criteria to be established by the ChiefInformation Officer for purposes of the certification under thisparagraph and submitted to the appropriate committees of Congress notlater than January 1, 2013.

(2)CONSTRUCTION- The limitation in paragraph (1) shall not apply to theNational Security Agency.

(b)Adaptation of Accumulo Security Features to HBase Database- TheDirector of the National Security Agency shall take appropriateactions to ensure that companies and organizations developing andsupporting open source and commercial open source versions of theApache Foundation HBase and Cassandra databases, or similar systems,receive technical assistance f-rom government and contractordevelopers of software code for the Accumulo database to enableadaptation and integration of the security features of the Accumulodatabase.

Trước hết: Wow. Ủyban các Dịch vụ Vũ trang của Thượng viện đề xuất đểDoD dừng sử dụng Accumulo, và chỉ thị cho NSA giúp thúcđẩy mã nguồn Accumulo trở ngược lại cho các dự ánkhác, đặc biệt gọi ra HBase và Cassandra. Mức độ phứctạp được yêu cầu cho ngôn ngữ lập pháp như thế nàylà đáng ngạc nhiên. Theo những hoàn cảnh khác nhau, tôiđã thấy rằng sự phức tạp đang khuyến khích. Thay vàođó, tôi có quan tâm rằng SASC cảm thấy bị cưỡng báchvào danh sách đen một dự án nguồn mở cho DoD. Chắc chắncó một câu trả lời tốt hơn so với điều này chứ?

Hãy đặt lý do củaỦy ban sang một bên một lúc, và hãy nhìn vào biện phápmà họ đã đề xuất. Điều gì sẽ xảy ra nếu nó khôngphải là Accumulo, mà là một mẩu phần mềm khác nhỉ?Hãy tưởng tượng rằng chúng ta đang nói về Máy chủWeb Apache, Red Hat Enterprise Linux, Microsoft SharePoint, hay AdobeAcrobat. Nếu Quốc hội đặt bất kỳ gói phần mềm nàotrong số đó vào một danh sách đen, thì giới công nghiệpcó thể không hiểu nổi. Accumulo là không khác gì: mộtkhi nó từng được mở nguồn, thì Accumulo đã trở thànhphần mềm thương mại theo FAR và DFAR rồi. Quốc hộikhông được can thiệp theo cách này.

Còn hơn nữa. Yêu cầurằng Accumulo được chứng thực như “một cơ sở dữliệu nguồn mở thành công của Quỹ Apache với sự hỗtrợ và đa dạng hóa của giới công nghiệp, dựa vào cáctiêu chí được Giám đốc Thông tin thiết lập” là cựckỳ nguy hiểm cho Accumulo và cho nguồn mở nói chung. Làkhông đủ rằng phần mềm sẽ là thương mại, có chứcnăng và sẵn sàng ở chi phí hợp lý. Nó bây giờ phảicó “sự hỗ trợ và đa dạng hóa phù hợp của giớicông nghiệp”.

Nếu CIO của DoD bịcưỡng bức phải tạo ra những tiêu chí như vậy choAccumulo, thì nó không có nhiều sự tưởng tượng đểthấy rằng “những tiêu chí phù hợp” y hệt như vậyđược áp dụng cho tất cả các dự án phần mềmnguồn mở. Có một dự án nguồn mở ưa thích trong chươngtrình DoD của bạn, nhưng không có nhà cung cấp thươngmại nào chăng? Không phù hợp. Chỉ một nhà cungcấp cho gói phần mềm đó chăng? Thiếu sự đa dạng.Phần mềm sở hữu độc quyền không có gánh nặng nhưthế này.

Firstof all: Wow. The Senate Armed Services Committee proposes to orderthe DOD to stop using Accumulo, and direct NSA to help pushAccumulo’s code back to other projects, specifically calling outHBase and Cassandra. The level of sophistication required forlegislative language like this is astonishing. Under differentcircumstances, I’d find that sophistication encouraging. Instead,I’m concerned that SASC feels compelled to blacklist an open sourceproject for the DOD. Surely there’s a better response than this?

Let’sput the Committee’s reasoning to the side for a moment, and lookAdoat the remedy proposed. What if it wasn’t Accumulo, but anotherpiece of software? Imagine that we’re talking about the Apache WebServer, Red Hat Enterprise Linux, Microsoft SharePoint, or AdobeAcrobat. If Congress put any of those software packages on ablacklist, industry would lose its mind. Accumulo is nodifferent: once it was open sourced, Accumulo became commercialsoftware under the FAR and DFAR. Congress has no business interveningin this way.

There’smore. The requirement that Accumulo be certified as “a successfulApache Foundation open source database with adequate industry supportand diversification, based on criteria to be established by the ChiefInformation Officer” is extremely dangerous for Accumulo and foropen source in general. It’s not sufficient that the softwarebe commercial, functional and be available at reasonable cost. Itmust now have “adequate industry support and diversification.”

Ifthe DOD CIO is compelled to cre-ate such criteria for Accumulo, itdoesn’t take much imagination to see that same “adequacycriteria” applied to allopen source software projects. Got a favorite open source project onyour DOD program, but no commercial vendor? Inadequate.Only one vendor for the package? Lacksdiversity. Proprietarysoftware doesn’t have a burden like this.

Thelast clause of Section 929 is bewildering. SASC directs Accumulo tohelp other projects that want to use the Accumulo security code, andsingles out HBase and Cassandra. There’s nothing wrong with thedesire to spread Accumulo’s technology, but doesn’t an act ofCongress seem like an extraordinarily, comically inappropriate toolfor that? Wouldn’t the Accumulo team, like all open sourcedevelopers, be generally helpful with folks who want to integratetheir code? Perhaps more importantly, why is Congress so interestedin HBase and Cassandra?

Ithink the Committee (and whoever provided them this legislativelanguage) is right to be concerned about the government unnecessarilymaintaining a duplicative software project. It’s bad for theprivate sector, and it’s bad for the government to maintain its owncodebase when there are perfectly good al-ternatives elsewhe-re.

Mệnh đề cuối cùngcủa Phần 929 là gây hoang mang. SASC chỉ thị cho Accumulogiúp các dự án khác muốn sử dụng mã an ninh củaAccumulo, và tách bạch khỏi HBase và Cassandra. Không có gìsai với mong muốn lan rộng công nghệ Accumulo, nhưng khôngphải là một hành động của Quốc hội được xem nhưmột công cụ không phù hợp một cách khôi hài và lạthường cho điều đó? Đội Accumulo, giống như tất cảcác lập trình viên nguồn mở, thường hữu ích vói cácđám người muốn tích hợp mã nguồn của họ chứ? Cólẽ quan trọng hơn, vì sao Quốc hội lại quá quan tâm tớiHBase và Cassandra thế?

Tôi nghĩ Ủy ban (vàbất kỳ ai cung cấp cho họ ngôn ngữ lập pháp này) làđúng có quan tâm về việc duy trì không cần thiết củachính phủ một dự án phần mềm bị đúp bản. Điều đólà tồi tệ cho khu vực tư nhân, và là tồi tệ cho chínhphủ để duy trì kho mã nguồn của riêng mình khi có nhữnglựa chọn thay thế tốt tuyệt với ở đâu đó.

Cùng lúc, đám ngườicủa Accumulo hiển nhiên đã làm đúng bằng việc pháthành mã nguồn của họ, và thậm chí đi xa hơn khi thamgia vào Quỹ Apache, nó không phải là một nỗ lực nhỏ.Họ sẽ được tưởng thưởng vì cương vị quản giatuyệt vời cua họ đối với tiền của những ngườiđóng thuế. Thông qua nỗ lực của họ, mỗi người cóthể có lợi từ công việc mà họ đã làm - dù có haykhông có các lệnh pháp lý phải làm thế - và họ có khảnăng tuyệt vời để thắng hoặc thua về thị phần theonhững giá trị của riêng họ, chỉ giống như bất kỳai khác.

Vấn đề củaAccumulo này mở ra cánh cửa cho một đống các câu hỏivề vai trò của chính phủ trong các dự án nguồn mở.Trong phần 2, chúng ta sẽ đặt dự luật đặc biệt nàysang một bên và đưa ra các câu hỏi đằng sau sự làmluật: Liệu chính phủ có làm hại cho khu vực tư nhânkhi họ phát hành các dự án nguồn mở hay không? Làm thếnào chúng ta có thể biết khi nào nguồn mở là một cáchthức phù hợp cho chính phủ để phát triển phần mềm?Làm thế nào chính phủ điều hành được các bản rẽnhánh? Tôi cũng sẽ xem xétmột số biện pháp có khả năng có thể loại bỏ đượcnhu cầu cho một công cụ thô thiển nguy hiểm như Phần929.

Trongkhi chờ đợi, xin hãy để nghị sỹ của bạn biết bạncảm thấy thế nào về điều này.

[Được cập nhậtlúc 17:37ET ngày 18/06/2012 để làm nhẹ bớt một số ngôntừ gây sợ hãi hơn và phân biệt rõ hơn Quốc hội vớiSASC].

[Được cập nhậtlúc 09:37ET ngày 19/06/2012 để bổ sung thêm một số sựlàm rõ, sửa một số lỗi chính tả; và chuẩn bị chungcho việc đưa lên opensource.com.]

Atthe same time, the Accumulo folks indisputably did the right thing byreleasing their code, and even went so far as to join the ApacheFoundation, which is no small effort. They should be rewarded fortheir excellent stewardship of taxpayer money. Through their effort,everyone can already benefit f-rom the work that they’ve done –with or without legislative orders to do so – and they’reperfectly capable of winning or losing market share on their ownmerits, just like everyone else.

ThisAccumulo issue opens the door to a host of valid questions about therole of government in open source projects. Inpart two, we’ll put this specific bill aside and ask thequestions behind the legislation: doesthe government harm the private sector when they release open sourceprojects? How can we know when open source is an appropriate way forthe government to develop software? How should the government handleforks? I’ll alsoexamine some possible remedies that could eliminate the need for adangerously crude tool like Section 929.

Inthe meantime, please letyour Senator know how you feel about this.

[Up-dated18 June 2012 17:37ET to soften some of the more alarmist language andmore clearly distinguish Congress f-rom SASC.]

[Up-dated19 June 2012 09:37ET to add some clarity, fix some grammar, andgenerally prepare for posting on opensource.com.]

Dịch: Lê Trung Nghĩa

letrungnghia.foss@gmail.com

Tổng số điểm của bài viết là: 0 trong 0 đánh giá

Click để đánh giá bài viết

  Ý kiến bạn đọc

Những tin mới hơn

Những tin cũ hơn

Về Blog này

Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...

Bài đọc nhiều nhất trong năm
Thăm dò ý kiến

Bạn quan tâm gì nhất ở mã nguồn mở?

Thống kê truy cập
  • Đang truy cập104
  • Hôm nay1,741
  • Tháng hiện tại131,766
  • Tổng lượt truy cập14,281,480
Bạn đã không sử dụng Site, Bấm vào đây để duy trì trạng thái đăng nhập. Thời gian chờ: 60 giây