Helpex - Trao đổi & giúp đỡ Đăng nhập

API có sẵn sàng cho lời nói của đám mây không?

Nhiều người coi xử lý ngôn ngữ tự nhiên là lợi thế hàng đầu của trí tuệ nhân tạo xâm nhập vào các hoạt động kinh doanh hàng ngày. Peter Sayer của IT World viết trong một bài báo ngày 24 tháng 5 năm 2017, các công nghệ giọng nói được hỗ trợ bởi AI là trung tâm của các trợ lý ảo phổ biến như Siri của Apple, Cortana của Microsoft, Alexa của Amazon và Bixby của Samsung  .

Bất kỳ điểm yếu nào trong bài phát biểu AI hiện diện trong các sản phẩm tiêu dùng đó đều dễ dàng hơn đối với nhiều công ty vì các hệ thống cũng được chú ý về khả năng chạy trên phần cứng đơn giản, năng lượng thấp - không cần siêu máy tính.

Sắp có đám mây gần bạn: Phân tích giọng nói tự động

Phân tích giọng nói của máy đã có một bước tiến lớn với tính khả dụng chung gần đây của API Cloud Speech của Google, được phát hành lần đầu tiên dưới dạng bản beta mở vào mùa hè năm 2016. API Cloud Speech sử dụng cùng một công nghệ mạng thần kinh được tìm thấy trong Google Home và Sản phẩm giọng nói của Trợ lý Google. Như Kent Weare của InfoQ viết trong một  bài báo ngày 6 tháng 5 năm 2017, API hỗ trợ các dịch vụ bằng 80 ngôn ngữ khác nhau.

Giám đốc sản phẩm của Google, Dan Aharon, trích dẫn ba trường hợp sử dụng máy tính - con người điển hình cho API Cloud Speech: di động, web và IoT.

API có sẵn sàng cho lời nói của đám mây không?

Tương tác giữa con người và máy tính mà API giọng nói tạo điều kiện bao gồm tìm kiếm, lệnh, nhắn tin và đọc chính tả. Nguồn: Google, qua  InfoQ

Theo Aharon, trong số các ưu điểm của giao diện giọng nói đám mây là tốc độ (150 từ mỗi phút, so với 20-40 wpm để gõ); giao diện đơn giản; nhập liệu rảnh tay; và sự phổ biến ngày càng tăng của các thiết bị luôn lắng nghe như Amazon Echo, Google Home và Google Pixel.

Một ví dụ điển hình về nguồn tài nguyên dựa trên giọng nói bị mất đối với các doanh nghiệp là các cuộc điện thoại dịch vụ khách hàng. Giám đốc công nghệ viễn thông tương tác Gary Graves cho biết API Cloud Speech cho phép công ty thu thập "thông tin thông minh có thể hành động" từ các bản ghi âm các cuộc gọi của khách hàng đến bộ phận dịch vụ. Ngoài việc cung cấp cho các nhà quản lý các công cụ để cải thiện dịch vụ khách hàng, thông tin tình báo thu thập được còn giúp nhân viên có trách nhiệm. Các đại lý ô tô đã cho thấy trách nhiệm giải trình cao hơn chuyển trực tiếp đến việc tăng doanh số bán hàng.

Nhân hóa và hợp lý hóa các tương tác bằng giọng nói tự động

Việc phải điều hướng qua các cây đa cấp của hệ thống phản hồi bằng giọng nói có thể khiến khách hàng cảm thấy khó chịu trong những ngày giữ hàng dài. Twilio gần đây đã công bố phiên bản beta của API nhận dạng giọng nói tự động chuyển đổi giọng nói thành văn bản, cho phép các nhà phát triển tạo ra các ứng dụng phản hồi các câu nói tự nhiên của người gọi. So sánh: "Cho chúng tôi biết lý do bạn gọi" với "Nếu bạn muốn nói chuyện với một người hỗ trợ, hãy nói 'hỗ trợ'." Blair Hanley Frank của Venture Beat báo cáo về bản phát hành beta trong một  bài báo ngày 24 tháng 5 năm 2017 .

ASR của Twilio dựa trên API Google Cloud Speech; nó xử lý 89 ngôn ngữ và phương ngữ khác nhau và có giá từ hai xu cho mỗi 15 giây nhận dạng. Cũng được Twilio công bố là một API phổ quát cung cấp cho các ứng dụng thông tin về mục đích của ngôn ngữ tự nhiên mà nó xử lý. API Hiểu hoạt động với Amazon Alexa ngoài các công cụ SMS và Thoại của riêng Twilio.

Điểm mạnh về đám mây của Amazon có thể là điểm yếu trong dịch vụ thoại không?

Để so sánh, thông báo tháng 3 năm 2017 của Amazon về trung tâm liên hệ dựa trên đám mây Amazon Connect cố gắng tận dụng sự tích hợp được tích hợp sẵn của nó với Amazon DynamoDB, Amazon Redshift, Amazon Aurora và các dịch vụ AWS hiện có khác. Ingrid Lunden của TechCrunch viết trong một  bài báo ngày 28 tháng 3 năm 2017  rằng Amazon hy vọng sẽ tận dụng chi phí thấp so với các trung tâm cuộc gọi không dựa trên đám mây, cũng như không yêu cầu chi phí trả trước hoặc hợp đồng dài hạn.

Một tính năng chính của Amazon Connect là khả năng tạo phản hồi tự động tích hợp với Amazon Alexa và các hệ thống khác dựa trên dịch vụ Amazon Lex AI. Thay vì trở thành một lợi thế, sự tích hợp chặt chẽ của Amazon Connect với Lex và các dịch vụ AWS khác có thể là vấn đề đối với khách hàng tiềm năng, theo Zeus Kerravala trong một  bài đăng ngày 25 tháng 4 năm 2017  trên No Jitter.

Kerravala chỉ ra rằng cách tiếp cận "tự phục vụ" mà Amazon áp dụng để triển khai hệ thống phản hồi giọng nói tùy chỉnh của công ty là một thách thức đối với các nhà phát triển. Các doanh nghiệp muốn triển khai Amazon Connect trước tiên phải hoàn thành quy trình đăng ký AWS gồm bảy bước bao gồm việc chỉ định nhóm S3 sẽ được sử dụng để lưu trữ.

API có sẵn sàng cho lời nói của đám mây không?

Trung tâm liên hệ Amazon Connect yêu cầu nhiều bước để định cấu hình cho một doanh nghiệp cụ thể sau khi bạn đã hoàn tất quy trình thiết lập AWS ban đầu. Nguồn:  Amazon Web Services

Theo Kerravala, các nhà phát triển không phải là khách hàng truyền thống của hệ thống trung tâm cuộc gọi và nhiều khách hàng tiềm năng của Amazon Connect sẽ phải vật lộn để tìm ra tài năng nội bộ cần thiết để ghép nhiều mảnh AWS lại với nhau để tạo ra một hệ thống phản hồi bằng giọng nói dựa trên AI .

Dân chủ hóa AI, phong cách của Microsoft

Chỉ trong hai tháng, hệ thống học sâu mã nguồn mở Bộ công cụ nhận thức của Microsoft đã chuyển từ bản phát hành sang phiên bản 2.0, như báo cáo của Pedro Hernandez trên eWeek trong một bài báo  ngày 2 tháng 6 năm 2017 . Trước đây được gọi là Bộ công cụ mạng tính toán (CNTK), bản phát hành tính khả dụng chung hỗ trợ cho  thư viện mạng thần kinh Keras , có API nhằm hỗ trợ tạo mẫu nhanh bằng cách tiếp cận "lấy người dùng làm trung tâm". Mục đích là cho phép những người có ít hoặc không có kinh nghiệm về AI đưa công nghệ máy học vào ứng dụng của họ.

API có sẵn sàng cho lời nói của đám mây không?

Microsoft tuyên bố Bộ công cụ nhận thức của họ mang lại lợi thế tốc độ rõ ràng so với Caffe, Torch và TensorFlow của Google thông qua khả năng mở rộng hiệu quả trong cài đặt đa GPU / đa máy chủ. Nguồn:  Mạng nhà phát triển Microsoft

Theo Microsoft, ba xu hướng đang hội tụ để cung cấp khả năng AI cho các ứng dụng kinh doanh hàng ngày:

  • Sức mạnh tính toán của điện toán đám mây
  • Các thuật toán nâng cao và khả năng học máy
  • Truy cập vào kho dữ liệu khổng lồ dựa trên đám mây

Mark Kaelin của TechRepublic viết trong một  bài báo ngày 22 tháng 5 năm 2017  rằng Dịch vụ Nhận thức của Microsoft kết hợp với hệ thống đám mây Azure của công ty để cho phép triển khai chức năng nhận dạng khuôn mặt chỉ bằng cách thêm một vài dòng mã vào một ứng dụng kiểm soát truy cập hiện có. Các dịch vụ AI "được tạo sẵn" khác có sẵn thông qua kết hợp Azure / Dịch vụ nhận thức là API Video, API giọng nói của người dịch, API văn bản dịch, API đề xuất và API tìm kiếm hình ảnh Bing; công ty hứa hẹn sẽ có thêm nhiều dịch vụ và API tích hợp như vậy trong tương lai.

Mặc dù chắc chắn rằng các ứng dụng dựa trên AI sẽ thay đổi cách mọi người tương tác với doanh nghiệp, nhưng ai cũng đoán được liệu những thay đổi đó sẽ cải thiện những tương tác đó hay khiến chúng trở nên khó chịu hơn nhiều hệ thống tự động hiện nay. Nếu lịch sử là bất kỳ dấu hiệu nào, nó có thể là một chút của cả hai.

0 hữu ích 0 bình luận 3.7k xem chia sẻ

Có thể bạn quan tâm

loading