Trở lại năm 2012, HBR đặt tên là “nhà khoa học dữ liệu” là “công việc quyến rũ nhất của thế kỷ.” Nhưng khoa học dữ liệu thực sự đòi hỏi điều gì? Và quan trọng hơn, làm thế nào bạn có thể có được các kỹ năng cần thiết để tự gọi mình là một nhà khoa học dữ liệu?
Khoa học dữ liệu là gì?
Ngày xửa ngày xưa, các nhà khoa học dữ liệu chủ yếu nằm trong không gian học thuật. Bây giờ, với sự bùng nổ của việc thu thập dữ liệu lớn và nhu cầu phân tích, các nhà khoa học dữ liệu đã trở thành nhu cầu cao trong một loạt các công ty và các ngành công nghiệp, nhỏ và lớn.
Khoa học dữ liệu như một nghề kết hợp một loạt các kỹ năng trong toán học, thống kê và lập trình máy tính. Nó là một ngành công nghiệp thống trị bởi đàn ông, ước tính của phụ nữ trong khoa học dữ liệu là khoảng 10%.
Theo Glassdoor, mức lương quốc gia trung bình cho các nhà khoa học dữ liệu là $ 113,436. Nhìn vào bồi thường một mình, khoa học dữ liệu hấp dẫn hơn rất nhiều so với các nghề nghiệp tương tự khác.
Kỹ năng cần thiết để trở thành một nhà khoa học dữ liệu
Giống như tất cả các công việc, các kỹ năng cụ thể cần thiết để lấp đầy các vị trí khoa học dữ liệu phụ thuộc vào từng công ty.
Nhưng có một số kỹ năng / công cụ phần mềm nhất định vẫn nhất quán.
- Ngôn ngữ lập trình thống kê, như R và SAS
- Ngôn ngữ truy vấn cơ sở dữ liệu như SQL
- Thống kê cơ bản như kiểm tra thống kê, phân phối, ước tính khả năng tối đa, v.v.
- Các phương pháp học máy như k-lân cận, rừng ngẫu nhiên, phương pháp tập hợp, v.v.
- Phép tính đa biến và đại số tuyến tính
- Ghi nhật ký dữ liệu và phát triển các sản phẩm mới được định hướng dữ liệu
- Quen thuộc với nền tảng Hadoop
- Các công cụ trực quan hóa như Flare, HighCharts hoặc AmCharts
Làm thế nào để trở thành một nhà khoa học dữ liệu
Ngày nay, có ba lựa chọn khả thi để trở thành một nhà khoa học dữ liệu:
- Tự học thông qua các chương trình như Udacity
- Tham dự trại khởi động khoa học dữ liệu
- Đi học đại học để lấy bằng thạc sĩ
Tất nhiên, có những ưu và khuyết điểm đối với từng phương pháp.
Tự học
Ưu điểm:
- Thuận tiện: có thể được thực hiện vào thời gian của bạn trong bất kỳ môi trường nào và ở bất kỳ tốc độ nào
- Giá cả phải chăng: có thể có giá từ 0-600 đô la.
- Tiết kiệm thời gian: các khóa học trực tuyến có thể được hoàn thành trong vòng 8-18 tháng.
Nhược điểm:
- Chỉ nhận được chứng chỉ sau khi hoàn thành
- Không có sự tham gia ngang hàng hoặc giáo viên-học sinh
- Không hỗ trợ tìm việc
Trại khởi động khoa học dữ liệu
Ưu điểm:
- Cam kết ít thời gian: có thể hoàn thành sau 6 tuần đến 3 tháng
- Tương đối phải chăng, ít nhất so với việc lấy bằng thạc sĩ (các trại khởi động từ miễn phí - $ 16,000)
- Lý tưởng cho những người muốn thay đổi nghề nghiệp nhanh chóng
- Nhiều chương trình đào tạo hỗ trợ trong quá trình tìm kiếm công việc sau khi hoàn thành
Nhược điểm:
- Chỉ nhận danh mục dự án - không có kinh nghiệm làm việc "thực"
- Rất nhiều thứ để học trong một khoảng thời gian ngắn
- Có thể lên đến 40 giờ một tuần làm việc (không giống như tự học, nơi bạn có thể đi theo tốc độ của riêng bạn và vẫn làm việc bán thời gian / toàn thời gian)
Bằng thạc sĩ
Ưu điểm:
- Văn bằng sau khi hoàn thành
- Học tập có cấu trúc với các giảng viên được đào tạo chuyên nghiệp
- Kinh nghiệm thực tế: nhiều chương trình bao gồm thực tập sẽ bổ sung vào trải nghiệm và kiến thức
- Đủ thời gian để tìm hiểu và hấp thu tất cả thông tin
Nhược điểm:
- Đắt tiền: có thể có giá từ $ 20,000 đến $ 70,000 - không bao gồm chi phí sinh hoạt
- Tốn thời gian: cũng có thể mất nhiều thời gian nhất (9-20 tháng)