6

Một cuốn sách đánh giá về Khám phá khoa học dữ liệu của John MountNina Zumel

John Mount và Nina Zumel, đồng sáng lập của một công ty tư vấn khoa học dữ liệu có trụ sở tại San Francisco, đã cho thấy kiến ​​thức về R và khoa học dữ liệu trong cuốn sách miễn phí mới của họ Khám phá Khoa học dữ liệu .

Được xuất bản thông qua Manning Publications như một nguồn thông tin miễn phí, Khám phá Khoa học dữ liệu vừa đơn giản vừa chi tiết, thô sơ và phức tạp. Nó là một "mẫu" từ cuốn sách Khoa học dữ liệu thực tế của Mount và Zumel , cũng như các tiêu đề Manning khác, và nó trình bày kiến ​​thức là chủ đề của các khóa học Đại học nâng cao hoặc đào tạo chi tiết trong một công ty, nhưng xử lý kiến ​​thức đó một cách dễ dàng không thường thấy trong sách về ngôn ngữ lập trình.

Cuốn sách có năm chương, bao gồm các chủ đề từ chuỗi thời gian đến học sâu và thậm chí khai thác văn bản. Các chủ đề có nghĩa là giới thiệu nhưng cung cấp nhiều thời gian để đi sâu vào phân tích mã và thống kê. Ảnh chụp màn hình hoặc đoạn mã có mặt trong suốt các chương. Và các ví dụ trong thế giới thực lấy các khái niệm toán học khô khan và khiến chúng dễ nắm bắt hơn.

Đó là sự khác biệt giữa việc nói chuỗi thời gian là tập hợp những ngày mà bạn có thể gán thông tin trong bảng và phân tích, không có ngữ cảnh, so với việc xem dự báo thời tiết cùng với những giai thoại nhỏ về lịch sử. Điều thứ hai làm cho cuốn sách dễ đọc hơn và hấp dẫn với những người mới đến chủ đề này.

Nhưng một ví dụ về độ sâu Mount và Zumel khám phá một chủ đề xuất hiện trong chương về học sâu, bao gồm sự hiểu biết cơ bản về trí tuệ nhân tạo chỉ trong hai trang. Thời gian (và không gian từ) được dành cho phương pháp bắt chước các quá trình của bộ não con người. Hình ảnh cạnh nhau minh họa các khái niệm về các chức năng cơ bản của não và các kỹ thuật học sâu được mô phỏng theo chúng để tạo ra những cỗ máy có trí thông minh.

"Khoa học dữ liệu là một lĩnh vực rộng lớn, liên quan đến các khía cạnh của thống kê, học máy và kỹ thuật dữ liệu", Mount và Zumel viết trong phần giới thiệu. "Các công cụ, phương pháp và công việc trông như thế nào phụ thuộc rất nhiều vào miền vấn đề và quan điểm của bạn."

Nhưng họ nói thêm rằng trong khi cuốn sách chỉ đề cập đến ngôn ngữ lập trình của R, họ không bao giờ ngụ ý rằng đó là thứ này, và chỉ đây, ngôn ngữ mà các nhà khoa học dữ liệu có thể sử dụng, như thể nó là vua trên tất cả phần còn lại.

Họ viết: "Cuốn sách của chúng tôi, Khoa học dữ liệu thực tế với R , giới thiệu cho độc giả về mô hình dự đoán cơ bản bằng ngôn ngữ R. Nhưng chúng tôi chưa bao giờ có ý định rằng các nhà khoa học dữ liệu có thể tự giới hạn trong một miền vấn đề hoặc một ngôn ngữ thực hiện."

Cuốn sách miễn phí này có thể quá thô sơ đối với những người có kinh nghiệm với R và một số khái niệm có thể buồn tẻ đối với người đã nghiên cứu khoa học dữ liệu. Nhưng nếu bạn có một người bạn luôn tự hỏi về những gì bạn làm trong công việc của bạn hoặc một thiếu niên quan tâm đến ngôn ngữ lập trình và việc sử dụng chúng trong khoa học dữ liệu, thì đây là một cuốn sách đáng giá.

Giới thiệu về tác giả:

Nina Zumel có bằng tiến sĩ trong robotics từ Carnegie Mellon và hơn 12 năm kinh nghiệm R & D trong nghiên cứu quản lý khẩn cấp, tìm kiếm thông minh và giá cả trực tuyến. Cô đồng sáng tác Khoa học dữ liệu thực tế với R để giải quyết khoảng cách giữa nghiên cứu và thực hành kỹ thuật.

John Mount sản xuất nghiên cứu ứng dụng, tạo mẫu và đào tạo về khai thác thông tin, thuật toán và khai thác dữ liệu cho các doanh nghiệp quy mô web, quỹ phòng hộ và khởi nghiệp. Ông có thêm kinh nghiệm nghiên cứu trong ngành công nghệ sinh học.

Để kiểm tra, hãy tải xuống Khám phá Khoa học Dữ liệu miễn phí tại trang web của Ấn phẩm Manning.

Thẻ từ liên quan:

Yếu tố cần thiết

|