Helpex - Trao đổi & giúp đỡ Đăng nhập

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Biểu đồ và biểu đồ tri thức là những khái niệm và công nghệ chính cho những năm 2020. Chúng sẽ trông như thế nào và chúng sẽ kích hoạt những gì trong tương lai?

Chúng tôi đã theo dõi sự phát triển của đồ thị từ đầu những năm 2000 và xuất bản bản tin của Năm Đồ thị kể từ năm 2018. Đồ thị có nhiều ứng dụng bao gồm phân tích, AI và quản lý tri thức.

Tất cả những điều trên đều được xây dựng trên một nền tảng chung: dữ liệu. Đây là lý do tại sao cơ sở dữ liệu đồ thị là một công cụ quan trọng cho tất cả các ứng dụng đồ thị. Đổi lại, đó là lý do tại sao chúng tôi đã nỗ lực hơn nữa trong việc theo dõi các cơ sở dữ liệu biểu đồ tiến độ đang thực hiện. Để bắt đầu bản tin Năm Đồ thị đầu tiên cho những năm 2020, chúng tôi có một chút về mọi thứ.

Các trường hợp sử dụng từ eBay, Github, Google và UN. Các bản cập nhật và bản phát hành mới từ Arango, AWS, Cambridge Semantics, NebulaGraph, Neo4j, Ontotext, Oracle và Stardog. Nghiên cứu và ý tưởng mới.


Tính kiên trì của đa ngôn ngữ, cũng như biệt ngữ để sử dụng các mô hình dữ liệu và quản lý dữ liệu thay thế cho nhau tùy thuộc vào nhiệm vụ hiện tại, đang trở thành thông thường mới. Sau cơ sở dữ liệu quan hệ, khóa-giá trị, tài liệu, cột và chuỗi thời gian, liên kết mới nhất trong sự gia tăng tiến hóa này của cấu trúc dữ liệu là biểu đồ.

Cơ sở dữ liệu đồ thị và đồ thị tri thức đã và đang tạo ra làn sóng và được đưa vào các chu kỳ cường điệu trong vài năm qua. Tuy nhiên, lịch sử của họ đã quay ngược trở lại và đây mới chỉ là sự khởi đầu.

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

5 Xu hướng công nghệ cho những năm 20 đang bùng nổ, Phần 2: AI, Sơ đồ tri thức, Vô cực và Xa hơn

Sơ đồ tri thức có thể giải quyết những thách thức chính như quản trị dữ liệu nhưng cuối cùng, chúng có thể đóng vai trò là nền tảng kỹ thuật số để thống nhất triết lý thu nhận và tổ chức tri thức với thực tiễn quản lý dữ liệu trong thời đại kỹ thuật số.

Biểu đồ tri thức và đồ thị đôi khi được sử dụng thay thế cho nhau. Chúng không nên như vậy - chúng là hai thứ khác nhau. Như đã được Kurt Cagle lưu ý trong Từ điển Thuật ngữ Đồ thị của mình , Sơ đồ tri thức là các biểu đồ ngữ nghĩa, được ràng buộc rõ ràng với ý nghĩa.

Điều này có nghĩa là chọn một chất nền có thể tạo điều kiện thuận lợi cho việc xử lý ngữ nghĩa là một ý kiến ​​hay. Dưới đây là cách các nền tảng biểu đồ tri thức đang phát triển để hỗ trợ các ngôn ngữ truy vấn khác nhau, thúc đẩy khả năng tương tác và cố gắng đáp ứng người dùng ở vị trí của họ.

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Sơ đồ tri thức phát triển: Nền tảng nói ngôn ngữ của bạn

Sơ đồ tri thức là một trong những công nghệ quan trọng nhất cho những năm 2020. Đây là cách chúng phát triển, với các nhà cung cấp và cơ quan tiêu chuẩn lắng nghe và các nền tảng trở nên thông thạo nhiều ngôn ngữ truy vấn

Neo4j vừa phát hành cái mà nó gọi là "bản phát hành sản phẩm quan trọng nhất trên thị trường công nghệ đồ thị cho đến nay." Điều đó có đúng hay không là do bạn quyết định. Tuy nhiên, điều đúng là Neo4j 4.0 giải quyết một số điểm đau mãn tính. Hơi nghịch lý lúc đầu hơi đỏ mặt, điều này liên quan đến sự phát triển của các nền tảng đồ thị tri thức. Neo4j lấy một trang từ lịch sử cơ sở dữ liệu đồ thị để thêm vào sự phát triển của chính nó.

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Neo4j 4.0 thêm Enterprise Fabric vào Cơ sở dữ liệu đồ thị của nó

Trong bản phát hành mới, Neo4j giải quyết các mối quan tâm chính đối với việc áp dụng của doanh nghiệp. Khả năng mở rộng, bảo mật, quản lý và thay đổi kiến ​​trúc đều có ở đây. Và cảm giác deja-vu kỳ lạ cũng vậy.

Thêm tin tức về cơ sở dữ liệu đồ thị: Oracle cung cấp cơ sở dữ liệu đồ thị và các sản phẩm phân tích đồ thị miễn phí cho người có giấy phép sản phẩm Oracle. AWS đã triển khai một loạt các tính năng mới và liệt kê tất cả chúng ở một nơi. Một cơ sở dữ liệu đồ thị nguồn mở mới, NebulaGraph , đang được một số người chú ý. Và ArangoDB đặt ra đa mô hình có thể đối phó với các thách thức về biểu đồ tri thức.

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Sơ đồ tri thức đa mô hình

Bài viết này mô tả một số thách thức và cách biểu diễn dữ liệu linh hoạt của đa mô hình có thể giải quyết chúng

Google không chỉ giới thiệu thuật ngữ đồ thị tri thức cho thế giới. Nó cũng sử dụng những người chủ chốt trong không gian này và thúc đẩy sự phát triển của thứ đã không ngừng trở thành lược đồ có lẽ có ảnh hưởng nhất trên thế giới: schema.org.

Gần đây, schema.org v.6 đã được phát hành, có rất nhiều cải tiến nhỏ nhưng hữu ích. Như Aaron Bradley lưu ý , Hướng dẫn loại mới, Khuyến nghị có thể được quan tâm đối với tiếp thị kỹ thuật số. Như dữ liệu của WooRank cho thấy, 28% trong số 20 triệu trang web đang sử dụng Dữ liệu có cấu trúc

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Bản phát hành Schema.org

Trang này liệt kê các bản phát hành schema.org, gần đây nhất trước tiên.

Một ứng dụng sớm được biết đến rộng rãi của biểu đồ tri thức là eBay. Tại đây, một số thành viên trong nhóm kỹ thuật của nó chia sẻ những hiểu biết của họ. Như họ lưu ý, đối với eBay, biểu đồ kiến ​​thức về ứng dụng / cơ sở hạ tầng là một biểu đồ thuộc tính không đồng nhất giúp cải thiện khả năng hiển thị kiến ​​trúc, hiệu quả hoạt động và năng suất của nhà phát triển.

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Phương pháp tiếp cận mới của eBay để quản lý kiến ​​trúc dịch vụ rộng lớn

Tìm hiểu cách phát triển biểu đồ kiến ​​trúc của eBay; những lợi ích mà eBay đã nhận được từ nó; và các trường hợp sử dụng mà chúng tôi thấy bây giờ và trong tương lai cho cách tiếp cận này.

Github đã mua lại một công cụ phân tích mã ngữ nghĩa có tên là CodeQL khi mua Semmle vào tháng 9 năm 2019. Công cụ này được cung cấp miễn phí cho nghiên cứu và phát triển mã nguồn mở, nhằm giúp các nhà nghiên cứu bảo mật tìm CVE mới và các nhà phát triển tự động kiểm tra bảo mật cơ sở mã của họ. GitHub sử dụng thư viện ngữ nghĩa để phân tích mã, xây dựng biểu đồ và học hỏi từ đó.

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Cách phân tích mã có thể giúp GitHub giải mã Đồ thị mã ngữ nghĩa của nguồn mở

Để làm cho các tính năng mới hoạt động, GitHub đang tạo một biểu đồ mã ngữ nghĩa của tất cả các kho lưu trữ công khai của nó. Điều đó mang lại cơ hội to lớn để hiểu và cải thiện các mẫu mã, chất lượng và bảo mật

LHQ đang làm việc với Dữ liệu được Liên kết để làm cho dữ liệu của mình hữu ích hơn (và có thể khám phá được) thông qua các truy vấn ngữ nghĩa. Phân loại các Mục tiêu Phát triển Bền vững của DESA được sản xuất với sự hợp tác của các chuyên gia kỹ thuật từ khắp hệ thống Liên hợp quốc. Một hệ thống Định danh Tài nguyên Quốc tế hóa (IRI) cho các SDG, các mục tiêu và chỉ số liên quan, và một Bản thể học Giao diện SDG đã được phát triển.

Các mã nhận dạng chung này được triển khai để cung cấp một yếu tố chính của cơ sở hạ tầng cho phép các tổ chức hệ thống của Liên hợp quốc và các bên liên quan lập bản đồ tài nguyên SDG của họ với nguồn kiến ​​thức ngày càng tăng về các SDG có sẵn trên web ngữ nghĩa. Một ứng dụng demo cũng có sẵn .

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Thư viện LHQ ra mắt nền tảng dịch vụ dữ liệu được liên kết

Làm cách nào để các công cụ tìm kiếm truy xuất kết quả và làm cách nào chúng ta có thể làm cho kết quả đã xuất bản của Liên hợp quốc phù hợp với những người tìm kiếm như vậy? Dữ liệu được liên kết là dữ liệu có cấu trúc được liên kết với nhau với dữ liệu khác, làm cho dữ liệu này trở nên hữu ích hơn (và có thể khám phá được) thông qua các truy vấn ngữ nghĩa.

Szymon Klarman là một chuyên gia về đồ thị tri thức độc lập đã tham gia vào dự án của Liên Hợp Quốc. Klarman từ lâu đã tham gia vào nỗ lực mang lại lợi ích của Semantic Web (chẳng hạn như URI và lược đồ) cho GraphQL. Hầu hết các phân tích liên quan cho đến nay đều coi GraphQL là giao diện cho Dữ liệu được Liên kết. Điều đó hợp lệ, nhưng có một cách khác, Klarman nói

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Web ngữ nghĩa có thể làm gì cho GraphQL?

Điều gì sẽ xảy ra nếu các tài nguyên GraphQL được chú thích bằng URI - số nhận dạng toàn cầu (Web ngữ nghĩa / dữ liệu được liên kết) biểu thị các khái niệm từ các từ vựng được chia sẻ, chẳng hạn như schema.org hoặc các bản thể luận chuyên dụng khác?

Làm việc với biểu đồ tri thức và tạo bản thể luận theo cách trực quan và hợp tác luôn có thể sử dụng một số công cụ tốt. Yêu cầu một nhóm kín lập mô hình thế giới và họ thường làm mà không cần phản hồi từ bên ngoài. Kết quả có thể mạnh mẽ nhưng dẫn đến bản thể học ít người sử dụng. Mọi người của Zazuko tin rằng điều này được thực hiện tốt nhất bằng cách sử dụng nền tảng web cộng tác và đây là lý do tại sao họ đã phát hành trình quản lý bản thể học dưới dạng mã nguồn mở.

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Bản phát hành mã nguồn mở của Trình quản lý Ontology Zazuko của chúng tôi

Hôm nay chúng tôi công bố bản phát hành mã nguồn mở của Trình quản lý Ontology Zazuko của chúng tôi. Đây là thứ mà chúng tôi đã làm việc trong một thời gian và chúng tôi đã lên kế hoạch phát hành nó dưới dạng mã nguồn mở khá nhiều kể từ khi chúng tôi bắt đầu làm việc trên nó cho một khách hàng của chúng tôi.

Allen Institute for AI đã và đang phát triển Đồ thị tham khảo ngữ nghĩa của học giả trong ngữ cảnh: một đồ thị trích dẫn theo ngữ cảnh lớn của 81,1 triệu ấn phẩm học thuật, bao gồm toàn văn được phân tích cú pháp cho 8,1 triệu bài báo truy cập mở, trên các lĩnh vực khoa học rộng lớn.

Một nỗ lực liên quan: thay vì trình bày nghiên cứu trong các bài báo PDF tĩnh, Trung tâm Nghiên cứu L3S làm việc trên một biểu đồ tri thức động. Biểu đồ tri thức của Nghiên cứu mở thể hiện các ý tưởng, cách tiếp cận, phương pháp ở dạng máy có thể đọc được .

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

GORC: Biểu đồ trích dẫn ngữ cảnh lớn của các bài báo học thuật

Chúng tôi giới thiệu Biểu đồ tham khảo ngữ nghĩa của học giả trong ngữ cảnh (GORC), một biểu đồ trích dẫn theo ngữ cảnh lớn của 81,1 triệu ấn phẩm học thuật, bao gồm toàn văn được phân tích cú pháp cho 8,1 triệu bài báo truy cập mở, trên nhiều lĩnh vực khoa học.

Kết thúc bằng một góc nhìn khác về biểu đồ tri thức. Nói chính xác là Weaviate đang xây dựng biểu đồ kiến ​​thức nguồn mở trong một hộp, hoặc một vùng chứa Docker. Nó sử dụng các mô hình nhúng biểu đồ được đào tạo trước mà người dùng có thể đào tạo thêm về dữ liệu miền cụ thể của họ, truy cập thông qua API REST và triển khai trên đám mây hoặc tại cơ sở.

Đồ thị vào những năm 2020: Cơ sở dữ liệu, Nền tảng và Sự phát triển của Tri thức

Làm suy yếu cuộc trò chuyện trên Google Cloud's Stack

Bob van Luijt là khách mời trong cuộc trò chuyện trên Google Cloud's Stack để nói về Weaviate và cách chúng tôi sử dụng Google Cloud @ SeMI Technologies.

Để nhận Bản tin Đồ thị của Năm trong hộp thư đến của bạn, hãy đăng ký tại đây .

17 hữu ích 0 bình luận 9.3k xem chia sẻ

Có thể bạn quan tâm

loading