AI-Powered NLP: Sự phát triển của trí tuệ máy từ học máy


Đặng Thanh Bình
2 năm trước
Hữu ích 4 Chia sẻ Viết bình luận 0
Đã xem 7510

Bài viết này được giới thiệu trong Hướng dẫn DZone mới về Trí tuệ nhân tạo. Nhận bản sao miễn phí của bạn cho các bài viết sâu sắc hơn, số liệu thống kê ngành và nhiều hơn nữa!

Bài viết này sẽ minh họa quá trình chuyển đổi cảnh quan NLP từ mô hình học máy sang lĩnh vực trí tuệ máy và dẫn dắt người đọc qua một vài ứng dụng quan trọng cùng với các thuật toán cơ bản của họ. Blog của Nav Gill về các giai đoạn của AI và vai trò của họ trong NLP trình bày tổng quan tốt về chủ đề này. Một số tài liệu nghiên cứu cũng đã được xuất bản để giải thích làm thế nào để đưa các thuật toán ML truyền thống lên cấp độ tiếp theo. Theo truyền thống, các kỹ thuật học máy cổ điển như máy vectơ hỗ trợ (SVM), mạng thần kinh, Bayes ngây thơ, mạng Bayes, Phân bổ Direntlet (LDA), v.v. được sử dụng để khai thác văn bản để thực hiện phân tích tình cảm, mô hình chủ đề, TFF IDF, NER v.v.

Tuy nhiên, với sự ra đời của các API nguồn mở như TensorFlow , bộ CoreNLP của Stanford, Caffe (BAIR) của Berkeley AI Research , Theano , Torch , Bộ công cụ nhận thức của Microsoft (CNTK) và API được cấp phép như api.ai , Cuộc trò chuyện Watson của IBM , Amazon Lex , API dịch vụ nhận thức của Microsoft dành cho lời nói (API dịch ngôn ngữ, API nhận dạng người nói, v.v.) và ngôn ngữ (API phân tích ngôn ngữ, API văn bản dịch, v.v.), thuật toán khai thác văn bản cổ điển đã phát triển thành kiến ​​trúc NLP học sâu như đệ quy và đệ quy mạng lưới thần kinh. Google Cloud, thông quaAPI ngôn ngữ tự nhiên (REST), cung cấp phân tích tình cảm, phân tích thực thể, phân tích tình cảm thực thể, phân tích cú pháp và phân loại nội dung. Trước khi đi sâu hơn vào các thuật toán học sâu bên dưới, hãy xem xét một số ứng dụng thú vị mà AI đóng góp cho lĩnh vực NLP.

Để bắt đầu với những tin tức điên rồ nhất, trí tuệ nhân tạo đang viết cuốn sách thứ sáu của A Song of Ice and Fire . Kỹ sư phần mềm Zack Thoutt đang sử dụng một mạng lưới thần kinh tái phát để giúp kết thúc câu chuyện sử thi của George RR Martin. Emma , được tạo ra bởi giáo sư Aleksandr Marchenko, là một bot AI để kiểm tra đạo văn làm hỗn hợp NLP, học máy và tạo hình. Nó giúp xác định quyền tác giả của các bài viết bằng cách nghiên cứu cách mọi người viết. Android Oreo có khả năng nhận dạng văn bản dưới dạng địa chỉ, ID email, số điện thoại, URL, v.v. và thực hiện hành động dự định một cách thông minh. Tính năng chọn văn bản thông minh sử dụng AI để nhận ra các từ thường được sao chép dưới dạng URL hoặc tên doanh nghiệp. Đám mây nhà phát triển IBM WatsonPhân tích giai điệu có khả năng trích xuất giai điệu của bất kỳ tài liệu nào như tweet, đánh giá trực tuyến, tin nhắn email, phỏng vấn, v.v. phong cách ngôn ngữ (phân tích, tự tin, dự kiến) và xu hướng xã hội (cởi mở, có lương tâm, thái quá, hiềm khích, phạm vi tình cảm). Công cụ này cũng cung cấp phân tích cấp độ câu để xác định các thành phần cụ thể của cảm xúc, phong cách ngôn ngữ và xu hướng xã hội được nhúng trong mỗi câu.

ZeroFox đang tận dụng AI trên NLP để phá vỡ sự cố bot spam của Twitter và bảo vệ các nền tảng xã hội và kỹ thuật số cho các doanh nghiệp. Google Brain đang tiến hành nghiên cứu sâu rộng để hiểu ngôn ngữ tự nhiên và đưa ra các giải pháp độc đáo như đề xuất tự động hoàn thành, tự động hoàn thành cho hình tượng trưng và tự động trả lời e-mail, cũng như thuật toán RankBrain để chuyển đổi tìm kiếm của Google. Dịch máy thần kinh của Googlegiảm trung bình 60% lỗi dịch thuật so với hệ thống dựa trên cụm từ cũ của Google. Quora đã tiến hành một cuộc thi Kaggle để phát hiện các câu hỏi trùng lặp trong đó các nhà tạo mô hình đạt độ chính xác 90%. Cuối cùng nhưng không kém phần quan trọng, việc trả lời câu hỏi liền mạch được thực hiện thông qua một số bộ xử lý ngôn ngữ tự nhiên thông minh nhân tạo như Dịch vụ thoại Alexa của Amazon (AVS), Lex và Polly , cùng với api.ai, archie.ai, v.v. trong các thiết bị như Echo và được tận dụng để hỗ trợ ảo thông qua các chatbot.

Do đó, sự thay đổi trong các bánh răng từ học máy sang trí thông minh máy đạt được thông qua trả lời câu hỏi thời gian thực tự động, phân tích cảm xúc, ngăn chặn thư rác, dịch máy, tóm tắt và trích xuất thông tin. Trong khi trọng tâm của ML là hiểu ngôn ngữ tự nhiên (NLU), MI hướng đến việc tạo ngôn ngữ tự nhiên (NLG) liên quan đến lập kế hoạch văn bản, lập kế hoạch câu và thực hiện văn bản. Thông thường, chuỗi Markov được sử dụng để tạo văn bản thông qua dự đoán của từ tiếp theo từ từ hiện tại. Một ví dụ kinh điển về chuỗi Markov có sẵn tại SubredditSimulator .

Tuy nhiên, với sự ra đời của các mô hình học sâu, một số thí nghiệm đã được thực hiện thông qua các từ được nhúng và các mạng thần kinh tái phát để tạo ra văn bản có thể giữ nguyên phong cách của tác giả. Cùng một tổ chức nghiên cứu, Indigo Research, đã xuất bản một blog gần đây cho thấy ứng dụng của bộ nhớ ngắn hạn (LSTM) trong việc tạo ra văn bản thông qua các ký ức về Hồi ký của một thông tin tiên nghiệm. Một số sáng kiến ​​nghiên cứu và phát triển hiện đang được tiến hành xử lý ngôn ngữ tự nhiên nhân tạo để phù hợp với quá trình xử lý ngôn ngữ của con người và cuối cùng cải thiện nó.

Bộ dữ liệu trả lời câu hỏi Stanford (SQuAD) là một trong những sáng kiến ​​như vậy, với hơn 100.000 cặp câu hỏi trả lời trên 5.222.300+ bài viết cũng được chia sẻ trong một cuộc thi Kaggle . Mạng đồng chú ý động (DCN) , kết hợp bộ mã hóa đồng chú ý với bộ giải mã điểm động, đã nổi bật với hiệu suất cao nhất (Kết hợp chính xác 78.7 và F1 85.6) trong SQuAD và tự động trả lời các câu hỏi về tài liệu. Các ứng dụng khác của thuật toán học sâu tạo ra trí thông minh của máy trong không gian NLP bao gồm các mô hình bộ nhớ ngắn hạn dài hai chiều (biLSTM) để lựa chọn câu trả lời không thực tế , mạng nơ ron tích chập (CNNs) để phân loại câu, các mạng thần kinh định kỳ cho các mô hình căn chỉnh từ , nhúng từ để nhận dạng giọng nói và các mô hình sâu đệ quy cho thành phần ngữ nghĩa . Kiệt tác của Yoav Goldberg và tất cả các khóa học chuyên dụng (Stanford, Oxford và Cambridge) về việc áp dụng học tập sâu về NLP càng chứng tỏ sự thay đổi mô hình từ ML sang MI trong không gian NLP.

Với sự phát triển của nền văn minh nhân loại, những tiến bộ công nghệ tiếp tục bổ sung cho nhu cầu ngày càng cao của đời sống con người. Do đó, sự tiến bộ từ học máy đến trí thông minh máy móc hoàn toàn hài hòa với định hướng và tốc độ phát triển của loài người. Vài tháng trước, blog của Nav Gill về các giai đoạn của AI và vai trò của chúng trong NLP đã quan sát thấy rằng chúng ta đã đạt đến giai đoạn trí tuệ máy móc, và giai đoạn tiếp theo là ý thức về máy móc. Cuối cùng, AI đã tạo ra rất nhiều sự cường điệu bởi một số người coi đó là rủi ro lớn nhất đối với nền văn minh. Tuy nhiên, giống như bất kỳ công nghệ nào, AI có thể làm nhiều điều tốt cho xã hội hơn là gây hại - khi được sử dụng đúng cách. Thay vì nguyên nhân dự đoán về ngày tận thế, AI có thể trở thành cứu cánh của nền văn minh với một bó lợi ích, từ việc phát hiện ung thư sớmđể canh tác tốt hơn .

Bài viết này được giới thiệu trong Hướng dẫn DZone mới về Trí tuệ nhân tạo. Nhận bản sao miễn phí của bạn cho các bài viết sâu sắc hơn, số liệu thống kê ngành và nhiều hơn nữa!

Hữu ích 4 Chia sẻ Viết bình luận 0
Đã xem 7510