Tự động hóa phân tích dữ liệu là điều bắt buộc đối với các doanh nghiệp vừa phải
Các nhà lãnh đạo công ty cỡ vừa đã đúng khi vui mừng về cơ hội khai thác giá trị trong bộ dữ liệu lớn của họ. Nhưng dữ liệu ở các công ty quy mô vừa có xu hướng lộn xộn – bảng tính và tệp văn bản thuần túy, nhiều định dạng khác nhau, rất khó (nếu không muốn nói là không thể) tích hợp. Phải mất rất nhiều thời gian và tiền bạc để làm sạch nó để làm cho nó hữu ích. Dữ liệu chất lượng kém, bị phân hủy có thể phá hoại ngay cả những sáng kiến tốt nhất, bao gồm cả AI được thiết kế để tăng giá trị và hiệu quả. Công ty HdL, một công ty dịch vụ chính phủ có trụ sở chính tại Brea, California, đã sử dụng dữ liệu của họ một cách chiến lược và đã đạt được hiệu quả đáng kể. Tác giả đưa ra ba bài học để các nhà lãnh đạo cân nhắc khi bắt đầu tự động hóa phân tích dữ liệu.
Khi các công ty quy mô vừa phát triển, họ phát triển các luồng dữ liệu và hồ dữ liệu (kho lưu trữ cho cả dữ liệu có cấu trúc và không có cấu trúc) quá lớn để một người hoặc thậm chí một nhóm có thể thao tác và sử dụng hiệu quả. Và ngay cả khi một công ty hiện đang thu được giá trị từ dữ liệu của mình, những người thực hiện công việc có thể tiếp tục, khiến công việc kinh doanh phải vội vàng tìm kiếm, thu hút và thuê các nhà phân tích dữ liệu đắt tiền.
Có một hệ thống hoạch định nguồn lực doanh nghiệp (ERP) có năng lực và cập nhật sẽ không giải quyết được vấn đề hoặc giảm bớt áp lực. Hầu hết các công ty quy mô vừa bắt đầu với ERP tập trung vào tài chính và bắt đầu triển khai các hệ thống để lưu trữ dữ liệu khác, chẳng hạn như hoạt động của khách hàng và thông lượng sản xuất – một động thái mang tính hoạt động hơn là chiến lược.
Do đó, tự động hóa phân tích dữ liệu khi doanh nghiệp phát triển là một hết sức ý tưởng tốt. Tự động hóa thường là nơi các lập trình viên viết các thuật toán thực hiện các công việc thủ công trước đó theo hướng dẫn. Làm như vậy sẽ trả cổ tức một cách nhanh chóng, thúc đẩy đổi mới và tăng trưởng hơn, đồng thời mở đường cho việc triển khai trí tuệ nhân tạo, giúp mọi thứ trở nên dễ dàng hơn, hiệu quả hơn và tiết kiệm chi phí. AI được mã hóa để học cách thực hiện một nhiệm vụ, theo một nghĩa nào đó là phát minh và viết các thuật toán của riêng nó.
Tuy nhiên, dữ liệu của các công ty quy mô vừa có xu hướng lộn xộn. Bảng tính và tệp văn bản thuần túy, nhiều định dạng khác nhau, rất khó nếu không muốn nói là không thể tích hợp. Phải mất rất nhiều thời gian và tiền bạc để làm sạch chúng để làm cho chúng trở nên hữu ích. Dữ liệu bị phân hủy, chất lượng kém có thể phá hoại ngay cả những sáng kiến tốt nhất, bao gồm cả AI được thiết kế để tăng giá trị và hiệu quả.
Như Joe Pucciarelli, Phó chủ tịch nhóm và cố vấn điều hành CNTT tại công ty nghiên cứu thị trường International Data Corporation (IDC), đã nói trong một hội thảo trên web gần đây của Channel Company, “Hầu hết các bộ dữ liệu của các tổ chức không ở trong tình trạng tốt. Chúng tôi nói về dữ liệu và phân tích như một chiến lược và ưu tiên, nhưng dữ liệu chưa sẵn sàng để hỗ trợ nó.… Hầu hết các tổ chức, khi họ đang cố gắng giải quyết một vấn đề, nhà phân tích đang làm việc với nó thường dành 75% + thời gian… chỉ cần chuẩn bị dữ liệu. ”
Như bạn có thể tưởng tượng, ROI trên thời gian dành cho việc đó là không tốt. Hãy xem cách một công ty hạng trung khai thác giá trị trong dữ liệu của mình và khám phá ba bước mà các nhà lãnh đạo doanh nghiệp hạng trung có thể làm để làm điều tương tự.
Cách một công ty cỡ vừa đối phó với dữ liệu của mình
Một trong những khách hàng của tôi, Công ty HdL – một công ty dịch vụ chính phủ có trụ sở chính tại Brea, California – được các thành phố tự quản ở California, Texas và các bang khác tham gia để phân tích việc phân phối doanh thu thuế bán hàng của các bang tương ứng để đảm bảo rằng thành phố hoặc thị trấn của họ đang nhận được chia sẻ công bằng của nó. HdL tìm kiếm sự phân bổ sai và chênh lệch mà các thành phố tự quản có thể chỉ ra khi kiến nghị tiểu bang giải quyết. Trọng tâm của công việc này là so sánh các cơ sở dữ liệu khác nhau để chỉ ra sự khác biệt ảnh hưởng đến việc ai sẽ nhận được doanh thu từ thuế bán hàng. Ví dụ, trong một cơ sở dữ liệu, một doanh nghiệp có thể được liệt kê ở Dublin, CA, nhưng trong hai cơ sở dữ liệu khác, doanh nghiệp có thể được liệt kê trong Pleasanton lân cận. Điều đó làm cho lỗi phân bổ thuế có khả năng xảy ra cao; Công việc của HdL là đánh bại nó.
40 triệu cư dân của California mua các sản phẩm chịu thuế từ 5,9 triệu người bán lại được cấp phép, tạo ra một bộ dữ liệu khổng lồ gồm gần 46 triệu hồ sơ thuế vào năm 2020. Trong nhiều năm, HdL thuê các nhà phân tích nghiên cứu dữ liệu như vậy mỗi quý, tìm kiếm những sai sót. Nhóm CNTT của HdL đã tạo ra phần mềm để trợ giúp, nhưng qua nhiều năm, nhóm phân tích của họ đã áp dụng nhiều kỹ thuật thủ công mang phong cách riêng và nhóm CNTT đã tồn đọng nhiều công việc để tiếp tục xây dựng cơ sở mã để bao gồm các kỹ thuật đó. Đối phó với công việc tồn đọng đang làm trì hoãn các dự án tự động hóa của HdL và việc phát triển các kỹ thuật mới để xử lý chênh lệch thuế hiệu quả hơn. Đồng thời, bang California cũng đang thực hiện những cải tiến của riêng mình, để lại ít sai lệch hơn có thể được tìm thấy bằng cách sử dụng các công cụ cũ của HdL. Matt Hinderliter, giám đốc dịch vụ kiểm toán tại HdL, cho biết: “Nhóm của chúng tôi luôn tìm kiếm các kỹ thuật phân tích mới để xác định các vị trí sai lệch khó tìm thấy. “Tuy nhiên, chúng tôi chủ yếu dựa vào việc xuất và thao tác thủ công dữ liệu trong Excel cũng như yêu cầu các nhà phân tích cấp cao xem xét thủ công các bảng tính thường vượt quá 70 nghìn hoặc 80 nghìn hàng dữ liệu.”
Để đối phó với các yếu tố gây căng thẳng cho cả bên ngoài (những cải tiến của California) và bên trong (bộ phận CNTT quá tải của HdL và phân tích thủ công tốn nhiều công sức), HdL – một công ty hạng trung với ngân sách trung bình – đã thuê một thực tập sinh tài năng đã lấy bằng thạc sĩ về phân tích dữ liệu toàn thời gian. . Cô đã có thể biến một số thành viên trong nhóm quy trình phân tích được sử dụng để xác định phân bổ sai tiềm năng thành các thuật toán có thể tạo ra nhiều cơ hội phân bổ lại doanh thu thuế hơn trong một phần thời gian.
Với mức tăng hiệu quả này, người ta có thể cho rằng HdL sẽ xem xét việc sa thải. Thay vào đó, bộ phận kiểm toán của nó đang tăng cường nhân sự để theo đuổi tất cả các cơ hội mà phân tích tự động có được. Và HdL đã tiến gần hơn đến việc tập trung triển khai và triển khai AI.
Nâng cao hiệu quả hoạt động hầu như luôn là ưu tiên hàng đầu của các công ty quy mô vừa. Trong một cuộc khảo sát của Channel Company về các nhà lãnh đạo CNTT thị trường trung bình, 75% trong số họ có doanh thu từ 50 triệu đô la đến 1 tỷ đô la, 58% người được hỏi cho biết ưu tiên hàng đầu của họ là cải thiện hiệu quả hoạt động. Điều đó vượt xa ưu tiên thứ hai của họ, làm tăng doanh thu mới (36%). Cả hai mục tiêu đều có thể được hỗ trợ bằng cách tự động hóa phân tích dữ liệu, giống như ở HdL.
Bắt đầu
Các công ty cỡ vừa không thể tận dụng mọi cơ hội. Ngân sách và lực lượng lao động của họ cũng như các hoạt động hàng ngày như vũ bão sẽ không cho phép điều đó. (Rốt cuộc, họ không phải là Google.) Vì vậy, các công ty quy mô vừa nên bắt đầu tự động hóa quy trình phân tích dữ liệu của họ bằng cách tập trung vào các lĩnh vực mà các hoạt động quan trọng không hiệu quả hoặc quá phụ thuộc vào một người hoặc một số ít người. Trước khi tự động hóa, HdL đã có 15 người dành một phần thời gian đáng kể để làm những gì các thuật toán đang làm ngày nay.
HdL đã làm công việc dữ liệu; nhiều doanh nghiệp – máy in, nhà cung cấp hệ thống ống nước, v.v. – thì không. Nhưng những công ty đó vẫn đang tích lũy dữ liệu và họ có thể hưởng lợi bằng cách sử dụng nó một cách chiến lược. Điều quan trọng là phải bắt đầu với một nền tảng vững chắc. Dưới đây là ba điều mà các nhà lãnh đạo cần xem xét khi bắt đầu tự động hóa phân tích dữ liệu.
Ưu tiên dọn dẹp. Dữ liệu trong một doanh nghiệp hạng trung thường rất lộn xộn và cần nhiều ngăn nắp trước khi nó có thể trở nên hữu ích. Một hoạt động cơ bản khác là xác định dữ liệu nào quan trọng và sau đó lọc dữ liệu đó. Lúc đầu, việc này có thể chậm và không tốn kém, vì vậy hãy tìm những lĩnh vực mà doanh nghiệp có thể thu hồi vốn trong năm đầu tiên. Điều đó sẽ biến những người hoài nghi thành những người tin tưởng.
Thuê đúng người. Giám đốc điều hành không phải là nhà phân tích. Họ thiếu thời gian, sự kiên nhẫn và kỹ năng để phân tích dữ liệu như một phần bổ sung cho các nhiệm vụ hàng ngày của họ. Các nhà phân tích kinh doanh là một phần lập trình viên, một phần doanh nhân. HdL bắt đầu với một thực tập sinh và thuê cô ấy làm nhà phân tích kinh doanh toàn thời gian.
Chuẩn bị dữ liệu. Chỉ khi dữ liệu của bạn được chuẩn bị kỹ lưỡng, bạn mới có thể bắt đầu nghĩ về AI. AI tạo ra logic của riêng mình từ việc phân tích các mẫu mà nó phát hiện ra trong dữ liệu. Mặc dù AI và máy học đều hữu ích và thú vị, nhưng cả hai công nghệ đều cần bộ dữ liệu lớn để đào tạo, với các kết quả tích cực và tiêu cực đã được xác nhận. Sau khi làm sạch đủ dữ liệu và một vài lần quét dựa trên thuật toán, hầu hết các công ty vừa phải sẽ có một tập dữ liệu đủ lớn và hữu ích để đào tạo một mô hình AI.
Các nhà lãnh đạo công ty cỡ vừa đã đúng khi hào hứng với cơ hội khai thác giá trị trong các bộ dữ liệu lớn. Bây giờ là lúc để bắt đầu hành trình nhiều năm này và cam kết thuê đúng tài năng trong khi thực hiện các bước gia tăng để tạo ra giá trị từ tự động hóa dữ liệu và các loại phân tích nâng cao khác.
Thế giới bản tin | Vina Aspire News
Nguồn : https://hbr.org/2021/10/automating-data-analysis-is-a-must-for-midsize-businesses