Let's talk about how to build a business with open source
Posted 17 Feb 2016 by Grant Ingersoll
Theo: https://opensource.com/business/16/2/open-founder
Bài được đưa lên Internet ngày: 17/02/2016
Trong phần mềm nguồn mở (PMNM), nếu bạn đóng góp đủ các bản vá cho kho mã, thì hầu hết các dự án sẽ làm cho bạn trở thành một người đệ trình (committer). Tôi nghĩ tôi sẽ không ngạc nhiên là sau đó bạn viết đủ các bài báo cho Opensource.com, họ trao cho bạn chuyên đề riêng của bạn. Trong trường hợp của tôi, đó là chuyên đề chủ đề mà gần như và đáng yêu đối với con tim của tôi - tìm kiếm nguồn mở, Xử ý Ngôn ngữ Tự nhiên - NLP (Natural Language Processing), và học bằng máy. Tôi cũng sẽ sử dụng nền tảng này để viết về môi trường nguồn mở rộng lớn hơn từ quan điểm của tôi như là một sáng lập viên công ty mà ở đó việc đóng góp cho nguồn mở là phần chính của những gì chúng tôi là. Hơn nữa, tôi có kế hoạch trong việc phỏng vấn và nhấn mạnh những người và công ty được xây dựng dựa vào nguồn mở, với mục tiêu mang sự thấu hiểu vào những gì không chỉ tiêu dùng sử dụng nguồn mở, mà còn sống và hít thở nó vì sự kiếm kế sinh nhai của bạn.
Để bắt đầu, sự giới thiệu thích đáng là cần thiết. Vào năm 2007, tôi đã đồng sáng lập ra Lucidworks, một công ty được xây dựng dựa vào và xung quanh Apache Lucene and Solr. Tôi cũng là đồng sáng lập của dự án Apache Mahout và là tác giả hàng đầu trong Thuần hóa Văn bản (Taming Text), một sách chỉ dẫn giới thiệu tìm kiếm dựa vào nguồn mở, học tập bằng máy, và NLP.
Giống như hầu hết các lập trình viên, những người đã tốt nghiệp trường cao đẳng vào giữa những năm 90, câu chuyện nguồn mở của tôi quay lại những ngày đầu sử dụng máy chủ Apache httpd, Tomcat, và Jakarta. Và trong khi những ngày đó từng có rất nhiều niềm vui và bỏ nhiều thời gian vào những điều tốt lành ở Quỹ phần mềm Apache (Apache Software Foundation) và các nơi khác, tôi đã thực sự cắn răng trong việc đóng góp cho nguồn mở cho tới năm 2004. Đó là, khi tôi đã ra nhập Trung tâm Xử lý Ngôn ngữ ở Đại học Syracuse (Center for Natural Language Processing at Syracuse University), nơi tôi xây dựng một máy tìm kiếm liên ngôn ngữ giữa tiếng Ả rập và tiếng Anh (như, vào các truy vấn tiếng Anh, có kết quả các tài liệu tiếng Ả rập).
Sau huấn luyện đại học cần thiết, ông chủ của tôi đã nói, “Chúng ta sử dụng Lucene. Hãy xem xét nó”. Và thế là bắt đầu. Lucene khi đó vẫn còn ở vào thời kỳ sơ khởi của nó - phiên bản 1.2, để so sánh với phiên bản hiện nay 5.4 - và nó còn thiếu vài thứ tôi cần (đối với các cao thủ tìm kiếm ở đây: khái niệm các vectors và vài việc xử trí ngôn ngữ). Sau vài bản vá mã, nhiều thư điện tử giúp những người khác, tham gia trong các thảo luận (bỏ thêm thời gian tìm hiểu mọi người), và tôi đã được mời trở thành một người đệ trình - committer. Phần còn lại, như họ nói, là lịch sử.
Tiến tới năm 2007, 3 người đệ trình chúng tôi và người sử dụng thứ 4 của Lucene đã tập hợp nhau lại thành lập công ty bây giờ là Lucidworks, với mục tiêu là “Red Hát trong Tìm kiếm”. Cuộc gặp đầu tiên của công ty chúng tôi từng là lần đầu tiên tôi thực sự đã gặp mặt đối mặt với một trong số các đồng sáng lập của tôi (Erik Hatcher), cho dù đã làm việc cùng nhau trong cộng đồng vài năm. Cùng năm đó, tôi cũng đã đồng sáng lập dự án Mahout và đã bắt đầu ném ra cuốn sách của tôi, Taming Text, cho các nhà xuất bản tiềm năng.
Qua vài năm, những đóng góp của tôi đã tiến bộ từ việc viết mã toàn thời gian tới việc quản lý một đội lớn các kỹ sư mà làm việc về pha trộn cả phần mềm nguồn mở và phần mềm nguồn đóng. Những đóng góp của tôi cho những thứ như Lucene và Solr là ít hơn và thưa hơn, nhưng tôi vẫn còn xử trí để đóng góp đôi lúc, cho một vài dự án mở mà tôi duy trì. Mô hình của chúng tôi như một công ty cũng đã thay đổi từ ban đầu làm tư vấn và hỗ trợ sang thành bán nền tảng dữ liệu cốt lõi mở mà tích hợp một số chiến lược (Solr, Spark) và các dự án nguồn mở thứ cấp, cũng như các mẩu có giá trị gia tăng của chúng tôi được đặt ở trên đỉnh.
Sự hiểu biết nguồn mở của riêng tôi cũng đã thay đổi đáng kể khi mà khái niệm nguồn mở đã tiến hóa từ khái niệm lý tưởng thành thực tế. Nguồn mở đã biến đổi từ một nhúm các cao thủ ẩn dật trong các tầng hầm giảng kinh phúc âm trong các diễn đàn ngách, trở thành một lực lượng quốc tế các lập trình viên cộng tác tạo ra các dự án mở.
Dù tôi vẫn còn tin vào nhiều lý tưởng của nguồn mở, thì tôi cũng biết rằng để cho nguồn mở tiếp tục thành công, phải có các đầu tư thương mại và phương tiện cho mọi người và các công ty để kiếm sôngs. Ở đâu và làm thế nào sự đầu tư đó được thực hiện (ví dụ, thông qua các Quỹ, nguồn mở “thương mại”, hoặc những đóng góp của cá nhân) và các mô hình kinh doanh có liên quan là mảnh đất màu mỡ phì nhiêu để thảo luận, và thứ gì đó chúng tôi sẽ khai thác trong các chuyên đề trong tương lai. Còn bây giờ, cảm ơn vì ra nhập với tôi ở đây. Tôi sẽ khai thác nguồn mở trong và vượt ra khỏi các kho và các diễn đàn thảo luận.
Bạn có ý tưởng gì về chuyên mục Người sáng lập Mở (Open Founder) không? Hãy để lại bình luận hoặc gửi những gợi ý của bạn tới open@opensource.com.
Bài báo này là một phần của Open Founder, một chuyên mục tập trung vào phần mềm nguồn mở và doanh nghiệp, được Grant Ingersoll, đồng sáng lập và CTO của Lucidworks, viết. Chuyên mục ban đầu sẽ dàn xếp với các lĩnh vực quan tâm của Grant như tìm kiếm, xử lý ngôn ngữ tự nhiên, dạy học bằng máy tính, và ông sẽ chia sẻ sự hiểu thấu giành được trong nhiều năm kinh nghiệm của ông khi quản lý một công ty nguồn mở.
In open source software, if you contribute enough patches to the code base, most projects will make you a committer. I guess I shouldn't be surprised then that when you write enough articles for Opensource.com, they give you your own column. In my case, that column will be called Open Founder, and I'm going to use this space to expand on past technical column themes that are near and dear to my heart—open source search, Natural Language Processing (NLP), and machine learning. I'm also going to use this platform to write about the broader open source space from my perspective as a founder of a company in which contributing to open source is a key part of who we are. Additionally, I plan on interviewing and highlighting other people and companies built on open source, with the goal of bringing insight into what it's like not only to consume open source, but to live and breathe it for your livelihood.
To get started, a proper introduction is necessary. In 2007, I co-founded Lucidworks, a company built on and around Apache Lucene and Solr. I'm also the co-creator of the Apache Mahout project and lead author on Taming Text, an open source-based introductory guide to search, machine learning, and NLP.
Like most developers who graduated college in the mid-'90s, my open source story goes back to the early days of using the Apache httpd server, Tomcat, and Jakarta. And while those days were a lot of fun and spent consuming much of the goodness put out by the Apache Software Foundation and other places, I didn't really cut my teeth on contributing to open source until 2004. That's, when I joined the Center for Natural Language Processing at Syracuse University, where I built a cross language search engine between Arabic and English (e.g., enter English queries, get back Arabic documents.)
After the requisite university training, my boss said, "We use Lucene. Go figure it out." And so it began. Lucene at the time was still in its infancy—version 1.2, as compared to the recently released 5.4—and it was missing a few things that I needed (for the search geeks here: term vectors and some language handling bits). After few code patches, a whole lot of emails helping others, participating in discussions (in addition spending time getting to know people), and I was invited to be a committer. The rest, as they say, is history.
Moving forward to 2007, three of us committers and a fourth user of Lucene banded together to form the company now known as Lucidworks, with the goal of being the "Red Hat of Search." Our first company meeting was the first time I actually met one of my co-founders (Erik Hatcher) face-to-face, despite having worked together in the community for several years. That same year, I also co-founded the Mahout project and began pitching my book, Taming Text, to potential publishers.
Over the years, my contributions have evolved from writing code full time to managing a large team of engineers that work on a mix of both open and closed source software. My code contributions to the likes of Lucene and Solr are fewer and farther between, but I still manage to contribute from time to time, in addition to a few open side projects I maintain. Our model as a company has also changed from primarily doing consulting and support to selling an open core data platform that integrates a number of strategic (Solr, Spark) and secondary open source projects, as well as our own value added pieces that layer on top.
My own understanding of open source has also significantly changed as concept of open source has evolved from one of idealism to practicality. Open source has transitioned from a bunch of hackers hidden away in basements preaching the gospel in niche forums, to an international pool of developers collaboratively creating projects in the open.
Although I still believe in many of the ideals of open source, I also know that in order for open source to continue to succeed, there has to be commercial investment and a means for people and companies to earn a living. Where and how that investment is made (for example, via Foundations, "commercial" open source, or individual contributions) and the related business models is rich and fertile ground for discussion, and something we will explore in future columns. For now, thanks for joining me here. I look forward to exploring open source within and beyond the code repositories and the discussion forums.
Do you have ideas for the Open Founder column? Leave a comment or send your suggestions to open@opensource.com.
This article is part of Open Founder, a column focused on open source software and business, written by Grant Ingersoll, co-founder and CTO of Lucidworks. The column primarily will align with Grant's areas of interest—search, natural language processing, machine learning—and he’ll share insights gained during his years of experience running an open source company.
Dịch: Lê Trung Nghĩa
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn
Blog này được chuyển đổi từ http://blog.yahoo.com/letrungnghia trên Yahoo Blog sang sử dụng NukeViet sau khi Yahoo Blog đóng cửa tại Việt Nam ngày 17/01/2013.Kể từ ngày 07/02/2013, thông tin trên Blog được cập nhật tiếp tục trở lại với sự hỗ trợ kỹ thuật và đặt chỗ hosting của nhóm phát triển...
Các bài trình chiếu trong năm 2024
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Các lớp tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ tới hết năm 2024
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
‘Digcomp 2.2: Khung năng lực số cho công dân - với các ví dụ mới về kiến thức, kỹ năng và thái độ’, EC xuất bản năm 2022
Tổng hợp các bài của Nhóm các Nhà cấp vốn Nghiên cứu Mở (ORFG) đã được dịch sang tiếng Việt
Tổng hợp các bài của Liên minh S (cOAlition S) đã được dịch sang tiếng Việt
Năm Khoa học Mở & Chuyển đổi sang Khoa học Mở - Tổng hợp các bài liên quan
Hội nghị Đối tác Dữ liệu Mở châu Á năm 2021 do Việt Nam lần đầu tiên chủ trì
Các khung năng lực trong hành động
Phong trào Bình dân học vụ số: Mục tiêu, đối tượng, nội dung, nguồn lực, phương thức tổ chức thực hiện
Khung năng lực AI cho giáo viên
Lễ công bố công khai Trung tâm Năng lực Kim cương châu Âu và dự án ALMASI
Ngày Phần mềm Tự do, Ngày Phần cứng tự do, Ngày Tài liệu Tự do
Bạn cần biết những gì về các khung năng lực AI mới của UNESCO cho học sinh và giáo viên
‘Khung năng lực AI cho giáo viên’ - bản dịch sang tiếng Việt
Bàn về 'Lợi thế của doanh nghiệp Việt là dữ liệu Việt, bài toán Việt' - bài phát biểu của Bộ trưởng Nguyễn Mạnh Hùng ngày 21/08/2025
Các tài liệu dịch sang tiếng Việt tới hết năm 2024
Các bài trình chiếu trong năm 2024
‘Tài liệu quan điểm của KR21 về Giữ lại Quyền Tác giả: Giữ lại các quyền trong kết quả đầu ra nghiên cứu để cho phép phổ biến mở kiến thức’ - bản dịch sang tiếng Việt
DeepSeek đã gây ra sự hoảng loạn trên thị trường — nhưng một số người cho rằng việc bán tháo là quá mức
Ứng dụng và phát triển Tài nguyên Giáo dục Mở (OER) tại Việt Nam
“Chúng tôi không có hào nước”: Sự đổi mới đột phá của AI nguồn mở
‘KHUYẾN NGHỊ VÀ HƯỚNG DẪN TRUY CẬP MỞ KIM CƯƠNG cho các cơ sở, nhà cấp vốn, nhà bảo trợ, nhà tài trợ, và nhà hoạch định chính sách’ - bản dịch sang tiếng Việt
Tập huấn thực hành ‘Khai thác tài nguyên giáo dục mở’ cho giáo viên phổ thông, bao gồm cả giáo viên tiểu học và mầm non tới hết năm 2024
Nhà khoa học AI hàng đầu của Meta cho biết thành công của DeepSeek cho thấy 'các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền'
Mark Zuckerberg: DeepSeek cho thấy vì sao nước Mỹ phải là ‘tiêu chuẩn nguồn mở toàn cầu’ của AI; không có lý do gì để suy nghĩ lại về việc chi tiêu
Dữ liệu để phân loại AI
50 công cụ AI tốt nhất cho năm 2025 (Đã thử và kiểm nghiệm)
‘Hướng dẫn triển khai Khuyến nghị Tài nguyên Giáo dục Mở. Lĩnh vực hành động 2: Phát triển chính sách hỗ trợ’ - bản dịch sang tiếng Việt