Bí mật ẩn sau những con số
Nghệ thuật tư duy dựa trên dữ liệu của tác giả Hoàng Hữu Đà do NXB Trẻ phát hành vừa đạt giải Khuyến khích - Giải thưởng Sách quốc gia lần thứ 6.
Thông qua cuốn sách, độc giả sẽ tiếp cận những điều rất thú vị về thống kê học và phân tích dữ liệu mà không được dạy trong một lớp học thông thường.
Ngay chương đầu tiên sẽ nói về luật số lớn và dùng nó để chứng minh, tại sao càng cá cược nhiều, bạn càng có nhiều khả năng thua lỗ? Tiếp đến, chương 3 sẽ lý giải thắc mắc tại sao các đồ vật được sản xuất trong quá khứ dường như luôn có tuổi thọ và độ bền tốt hơn bây giờ. Chương 6 kể lại câu chuyện Tấm Cám với một phiên bản khác của bài toán hạt đỗ - một thử thách hóc búa mà Tấm phải vượt qua để được đi hội.
Tác giả đưa ra cảnh báo, dù những con số, dữ liệu trên được tính toán hoàn toàn chính xác, nhưng khi chúng đặt sai ngữ cảnh hoặc diễn giải không đầy đủ lại có thể gây ra những hiểu lầm cho người tiếp nhận thông tin. Đồng thời, anh đưa ra lời khuyên, muốn phát huy được hết tác dụng của dữ liệu, khi phân tích cần kết hợp kiến thức chuyên ngành sâu rộng.
Điều thú vị là Nghệ thuật tư duy dựa trên dữ liệu được viết giống như một cuốn truyện, dễ đọc và truyền cảm hứng. Tư duy dữ liệu được hình thành một cách tự nhiên và có hệ thống thông qua những câu chuyện trải dài từ giới kinh doanh, khoa học đến showbiz, từ thời xa xưa đến dòng chảy hiện đại.
Độc giả sẽ bắt gặp chàng sinh viên ngỡ ngàng nhận ra, không giống trên phim, ta không thể kiếm tiền từ cờ bạc nếu dành quá nhiều thời gian cho nó; một nhân viên ngân hàng thấy bất mãn vì mức thu nhập của mình không tương xứng với con số đưa ra trên báo. Thậm chí là cách mà Đen Vâu tiên tri đề văn thông qua các bài hát… Qua việc bàn luận chuyện thường ngày, kể cả chỉ với kiến thức cơ bản về xác suất và thống kê, người đọc không còn tiếp nhận thông tin một cách “thơ ngây” nữa mà đã có phương pháp luận, có tư duy dữ liệu để hiểu biết hơn và đưa ra quyết định hợp lý.
Cuốn sách nhằm gợi mở sự yêu thích với những con số và phân tích thống kê. Và độc giả đã bớt lo ngại khi nhìn vào công thức toán học phức tạp. Sau tất cả, thứ chúng ta quan tâm hơn vẫn là ý nghĩa và cách diễn giải của những công thức, chứ không chỉ là làm thế nào có một đáp án đúng cho bài toán. Và với kiến thức đó, mọi người đều sẵn sàng để giải quyết những bộ dữ liệu trong công việc và cuộc sống.
Hãy nghĩ về dữ liệu như là cách giảm thiểu rủi ro
Trả lời câu hỏi của VietNamNet: “Chọn dữ liệu làm đề tài của cuốn sách, anh muốn hướng độc giả vào mục tiêu gì?”, tác giả Hoàng Hữu Đà cho biết: Ngày nay, những con số thống kê và dữ liệu có thể được thấy ở khắp mọi nơi. Tuy nhiên, để thực sự khai thác và lấy ra được những thông tin hữu ích từ chúng lại không hề đơn giản. Nghệ thuật tư duy dựa trên dữ liệu giúp người đọc thấy được giá trị của dữ liệu, cũng như biết cách để không bị lừa dối bởi những con số, vì dữ liệu có thể được hiểu theo rất nhiều cách khác nhau.
Chẳng hạn, khi dịch Covid-19 lan truyền chóng mặt, có một thông tin cho rằng tiêm vắc-xin làm tăng khả năng tử vong gấp 6 lần. Điều này là đúng nếu nhìn vào các con số. Nhưng lý do là vắc-xin được ưu tiên tiêm cho những người có nguy cơ cao và người cao tuổi, trong khi đây là nhóm người có nhiều khả năng tử vong hơn. Chỉ khi so sánh giữa hai nhóm người cùng đặc điểm về sức khỏe, thể chất, chúng ta mới thấy được hiệu quả của vắc-xin.
Ngoài ra, bạn đọc sẽ biết cách mà dữ liệu được sử dụng để hiểu hơn về thế giới, thông qua các ví dụ khám phá hạt Higgs dựa trên một điểm lồi của dữ liệu, hay cách mà các nhà khoa học chứng minh hút thuốc lá gây ung thư phổi nhờ vào nghiên cứu thống kê.
|
Tác giả Hoàng Hữu Đà đang là Chuyên viên nghiên cứu tại Quỹ Tiền tệ quốc tế (IMF), Washington, DC, Hoa Kỳ. |
Hoàng Hữu Đà cũng chia sẻ với VietNamNet về cách “dụ” độc giả đến với tác phẩm của mình bởi những con số và phân tích thống kê thường kém hấp dẫn với người đọc đại chúng. “Đúng là những con số trở nên khô khan nếu chỉ đứng một mình. Nhưng nếu đào sâu thông tin, chúng lại rất hấp dẫn và thú vị. Dữ liệu có mặt ở mọi nơi và nhiều khi con người chưa hiểu rõ về chúng. Chẳng hạn, cứ đến dịp cuối năm, chúng ta thường thấy thông tin về thưởng Tết và mức lương trung bình của nhân viên ngân hàng. Đa phần là những con số rất cao, khiến dân tình ngưỡng mộ.
Quả thật, ngân hàng là một ngành có mức đãi ngộ rất tốt. Nhưng con số trung bình có nhược điểm là không thể hiện được mức lương phổ biến của nhân viên. Ở đây có sự chênh lệch lớn, khi các sếp nhận thu nhập gấp nhiều lần bình thường, con số trung bình bị đẩy lên cao, trong khi phần lớn nhân viên chỉ nhận được thu nhập thấp hơn thế. Đó chỉ là một trong các ví dụ thể hiện rằng, các con số đem lại nhiều giá trị nhưng rất dễ bị hiểu sai".
Tác giả khẳng định dữ liệu đang trở thành thứ “dầu mỏ” mới của nền kinh tế số và khiến cuộc sống của nhân loại dễ dàng hơn. Các thuật toán trí tuệ nhân tạo, chẳng hạn như ChatGPT, thực chất là những cỗ máy vận hành để tìm ra các hình thái từ hệ thống dữ liệu lớn. Các doanh nghiệp ngày càng sử dụng nhiều dữ liệu để hiểu hành vi khách hàng và có thể cung cấp dịch vụ tốt hơn.
Bàn về việc vận dụng tư duy dữ liệu vào cuộc sống, Hoàng Hữu Đà cho rằng: “Hãy nghĩ về dữ liệu như là cách giảm thiểu sự không chắc chắn và rủi ro. Chẳng hạn, để chọn được ngành học phù hợp, bạn cần thông tin cụ thể, yêu cầu đầu vào, cơ hội nghề nghiệp trong tương lai. Quan trọng hơn, cần hiểu về bản thân xem mình mạnh ở điểm gì và yêu thích điều gì. Việc mỗi người tìm tòi và có thêm nhiều trải nghiệm trong cuộc sống chính là thu thập dữ liệu về bản thân. Một ví dụ khác là trước khi mua một món đồ có giá trị cao, tôi thường xem đánh giá ở trên mạng hoặc của người quen về chất lượng và tính năng của nó, mục đích là chọn đồ phù hợp nhu cầu”.
Tác giả Hoàng Hữu Đà
Hoàng Hữu Đà đang là Chuyên viên nghiên cứu tại Quỹ Tiền tệ quốc tế (IMF), Washington, DC, Hoa Kỳ. Mục tiêu của anh là ứng tuyển vào chương trình học Tiến sĩ (P.h.D) trong tương lai gần. Anh đang hoàn thiện bản thảo một cuốn sách mới về kinh tế học và cách ra quyết định dựa trên các nguyên lý kinh tế.
Ngoài ra, Hoàng Hữu Đà còn là chủ kênh YouTube Bài học 10 phút chia sẻ các kiến thức về xác suất - thống kê qua các video hoạt hình từ năm 2019. Hiện kênh đã có trên 70 nghìn lượt đăng ký và 6,7 triệu lượt xem.