Bài viết này đã được đồng xuất bản với Đánh dấu, một phòng tin tức điều tra phi lợi nhuận thách thức công nghệ để phục vụ lợi ích công cộng. Đăng ký nhận bản tin của nó đây.
Một phân tích của The Markup đã cho thấy các dự đoán tội phạm được đưa ra cho sở cảnh sát ở Plainfield, New Jersey hiếm khi trùng khớp với các tội phạm được báo cáo, điều này đã bổ sung thêm bối cảnh mới cho cuộc tranh luận về tính hiệu quả của phần mềm dự đoán tội phạm.
Geolitica, được gọi là PredPol cho đến khi đổi thương hiệu vào năm 2021, sản xuất phần mềm thu thập dữ liệu từ các báo cáo vụ việc tội phạm và đưa ra dự đoán hàng ngày về địa điểm và thời điểm tội phạm có nhiều khả năng xảy ra nhất.
Chúng tôi đã kiểm tra 23.631 dự đoán do Geolitica tạo ra trong khoảng thời gian từ ngày 25 tháng 2 đến ngày 18 tháng 12 năm 2018 cho Sở Cảnh sát Plainfield (PD). Mỗi dự đoán mà chúng tôi phân tích từ thuật toán của công ty đều chỉ ra rằng một loại tội phạm có khả năng xảy ra ở một địa điểm không được Plainfield PD tuần tra. Cuối cùng tỷ lệ thành công chỉ còn chưa tới nửa phần trăm. Ít hơn 100 dự đoán liên quan đến một tội phạm thuộc danh mục được dự đoán, điều này sau đó cũng đã được báo cảnh sát.
Đi sâu hơn, chúng tôi xem xét các dự đoán cụ thể về các vụ cướp hoặc hành hung nghiêm trọng có khả năng xảy ra ở Plainfield và nhận thấy tỷ lệ thành công thấp tương tự: 0,6%. Tình hình thậm chí còn tệ hơn khi chúng tôi xem xét các dự đoán về vụ trộm, có tỷ lệ thành công là 0,1%.
“Tại sao chúng tôi có được PredPol? Tôi đoán chúng tôi muốn đạt hiệu quả cao hơn trong việc giảm tội phạm. Và việc dự đoán được nơi chúng ta sẽ ở sẽ giúp chúng ta làm được điều đó. Tôi không biết nó đã làm được điều đó,” đội trưởng David Guarino của Plainfield PD nói. “Tôi không tin là chúng tôi thực sự sử dụng nó thường xuyên, nếu có. Đó là lý do vì sao cuối cùng chúng tôi đã loại bỏ được nó.”
Guarino lưu ý rằng những lo ngại về tính chính xác và sự không quan tâm chung của bộ đối với việc sử dụng phần mềm cho thấy rằng số tiền trả cho phần mềm của Geolitica có thể được chi tiêu tốt hơn ở nơi khác.
Guarino nói: “Chúng tôi có một chương trình cố vấn. “Có lẽ chúng tôi có thể dồn (tiền) vào đó trong mùa hè. Chúng tôi từng có khoảng 80 đứa trẻ.” MỘT hợp đồng giữa bộ và Geolitica đã liệt kê phí đăng ký 20.500 đô la cho kỳ hạn hàng năm đầu tiên và sau đó là 15.500 đô la cho thời gian gia hạn kéo dài một năm.
Chúng tôi đã gửi những phát hiện của mình và phương pháp luận cho Geolitica trước khi xuất bản. Các đại diện đã không trả lời nhiều yêu cầu bình luận.
Một báo cáo từ WIRED tuần trước tiết lộ rằng Geolitica sẽ ngừng hoạt động vào cuối năm nay. SoundThinking, một công ty công nghệ thực thi pháp luật trước đây có tên là ShotSpotter, đã thuê nhóm kỹ thuật của Geolitica, nhưng không thuê lãnh đạo cấp cao và đang trong quá trình mua lại một số tài sản trí tuệ của công ty. Khách hàng hiện tại của Geolitica đang được chuyển sang nền tảng tuần tra của SoundThinking.
“Chúng tôi tin rằng việc cung cấp cho các đối tác thực thi pháp luật của mình khả năng triển khai nguồn nhân lực hạn chế của họ có giá trị to lớn và khi được tích hợp hoàn toàn vào Bộ định tuyến tài nguyên, những tài sản bổ sung cao này sẽ tạo ra một hệ thống triển khai tốt nhất cho các cơ quan thuộc mọi quy mô,” Phó chủ tịch cấp cao của SoundThinking Sam Klepper đã viết trong một tuyên bố với The Markup.
Thông tin về việc ngừng hoạt động và chuyển đổi khách hàng sang SoundThinking không được đăng trên trang web hoặc tài khoản mạng xã hội của Geolitica. SoundThinking cũng đã mua HunchLab, một công ty cảnh sát dự đoán khác, từ Azavea vào năm 2018.
Klepper giải thích rằng SoundThinking có kế hoạch kết hợp một số thuật toán của Geolitica vào các hệ thống hiện có của riêng mình, nhưng “các thuật toán được đề cập không bao gồm bất kỳ mã nguồn mô hình dự đoán tội phạm nào cả. SoundThinking không mua bất kỳ công nghệ dự đoán tội phạm hoặc mã nguồn nào của Geolitica.”
Vào năm 2021, The Markup đã xuất bản một cuộc điều tra hợp tác với Gizmodo cho thấy rằng phần mềm của Geolitica có xu hướng nhắm mục tiêu không tương xứng vào các khu dân cư thu nhập thấp, người da đen và người Latinh ở 38 thành phố trên khắp đất nước. Cuộc điều tra của chúng tôi dựa trên dữ liệu được tải xuống vào tháng 1 năm 2021 từ một máy chủ lưu trữ đám mây không được bảo vệ được liên kết từ một trang trên trang web của Sở Cảnh sát Los Angeles. Máy chủ đó lưu trữ các dự đoán mà Geolitica đã cung cấp cho các sở cảnh sát ở hàng chục thành phố trên khắp đất nước trong gần ba năm. Quyền truy cập vào máy chủ đó sau đó đã bị hạn chế.
Cuộc điều tra của chúng tôi (The Markup’s) đã không phân tích chính xác mức độ hiệu quả của phần mềm Geolitica trong việc dự đoán tội phạm vì chỉ có 2 trong số 38 sở cảnh sát cung cấp dữ liệu về thời điểm các sĩ quan tuần tra các khu vực được dự đoán. Geolitica tuyên bố rằng việc gửi cán bộ đến một địa điểm dự đoán sẽ ngăn chặn tội phạm chỉ thông qua sự hiện diện của cảnh sát. Sẽ không thể xác định chính xác mức độ hiệu quả của chương trình nếu không biết những dự đoán nào mà các quan chức đã phản hồi và những dự đoán nào họ không phản hồi.
Sau khi chúng tôi yêu cầu thông tin này từ 38 phòng ban trong cuộc điều tra ban đầu của chúng tôi, chỉ Plainfield cung cấp cho chúng tôi dữ liệu có giá trị hơn một ngày về các địa điểm tuần tra của sĩ quan.
Chúng tôi đã kiểm tra độ chính xác của Geolitica bằng cách so sánh các dự đoán của hệ thống với các báo cáo tội phạm, vốn chỉ ghi lại những tội ác được báo cáo cho cảnh sát chứ không phải những trường hợp ai đó là nạn nhân nhưng quyết định không thông báo cho cơ quan thực thi pháp luật. Cục Thống kê Tư pháp đã báo cáo rằng chưa đến một nửa số tội phạm bạo lực và tài sản được trình báo cho cảnh sát vào năm 2022. Tỷ lệ trình báo cũng không nhất quán giữa các nhóm nhân khẩu học. Cơ quan thành lập trong một báo cáo năm 2012 rằng nạn nhân của tội phạm Da đen, La tinh và thu nhập thấp có nhiều khả năng trình báo tội phạm hơn người Da trắng và những người thuộc các hộ gia đình có thu nhập cao hơn.
Theo dữ liệu, các sĩ quan cảnh sát Plainfield cho biết đã đến thăm 129 trong số 23.760 địa điểm dự đoán do Geolitica cung cấp. Để tiến hành phân tích, chúng tôi đã lọc ra những dự đoán đó để tránh vấn đề về sự hiện diện của cảnh sát nhằm ngăn chặn các tội phạm tiềm ẩn và so sánh phần còn lại với danh sách các báo cáo vụ việc tội phạm thu được thông qua yêu cầu hồ sơ công cộng. Mỗi dự đoán được giao cho một trong bốn ca tuần tra hàng ngày của bộ và mỗi ca kéo dài 11 giờ 15 phút. Nếu tội phạm xảy ra ở địa điểm đó trong thời gian thay đổi, chúng tôi sẽ tính đó là dự đoán chính xác.
Độ dài của các cửa sổ dự đoán này là một vấn đề lớn, giáo sư luật Andrew Ferguson của Đại học Mỹ, tác giả cuốn sách Sự trỗi dậy của chính sách dữ liệu lớn, nói với The Markup sau khi được thông báo về những phát hiện của chúng tôi. Ông nói: “Phần tính thời gian là một hệ thống thiếu sót. Độ chính xác của nó được cho là ở chỗ các cảnh sát viên đến đúng lúc, đúng nơi chứ không phải ‘trong suốt ca làm việc cả ngày, sẽ xảy ra tội phạm.'”
Các quan chức của Plainfield cho biết họ chưa bao giờ sử dụng hệ thống này để chỉ đạo tuần tra. Thay vào đó, các quan chức cho biết tất cả các trường hợp khi hệ thống giám sát tự động gắn thẻ xe cảnh sát đã đến một địa điểm dự đoán đều là sự trùng lặp ngẫu nhiên xảy ra một cách tự nhiên khi các sĩ quan thường xuyên đi qua cộng đồng ngoại ô nhỏ về mặt địa lý. Để tính đến tất cả các khả năng, The Markup đã tiến hành phân tích với các vị trí dự đoán được tuần tra được bao gồm và lọc ra và không thấy sự khác biệt đáng kể trong kết quả.
Hồ sơ cho thấy rằng không có vụ bắt giữ nào trong số năm vụ bắt giữ xảy ra tại các địa điểm được dự đoán trong khoảng thời gian phân tích của chúng tôi có thể hình dung được là do các sĩ quan phản ứng với dự đoán của Geolitica, điều mà Guarino cũng đã xác nhận. Tương tự, chúng tôi đã hỏi 37 phòng ban khác ở cuộc điều tra trước đây của chúng tôi liệu họ có thể chỉ ra bất kỳ vụ bắt giữ nào xảy ra do kết quả trực tiếp của dự đoán của Geolitica, nhưng không ai có thể làm được. Các đại diện của cả Hiệp hội Luật sư bào chữa hình sự quốc gia lẫn Hiệp hội luật sư quận quốc gia đều không thể thu hồi một vụ án sắp được đưa ra xét xử trong đó vụ bắt giữ là kết quả trực tiếp của việc dự đoán tội phạm bằng thuật toán.
Bất chấp khẳng định của các quan chức Plainfield rằng phần mềm không được sử dụng để thông báo nơi các sĩ quan đã đi, vẫn có một trích dẫn trên Geolitica trang mạng từ cựu sĩ quan cảnh sát Plainfield, trung sĩ Larry Brown ca ngợi chương trình. Brown viết: “Vụ cướp tại một nhà hàng… Dự đoán và vụ cướp của PredPol cách xa 10 ft. “Tôi đào tạo hơn 100 sĩ quan của chúng tôi về cách tuần tra các hộp PredPol và tôi yêu thích những thành công của chúng tôi.”
Trong một email gửi tới The Markup, Guarino viết rằng anh ấy không quen với vụ việc Brown, người đã nghỉ hưu vào năm 2018, đã đề cập và không “biết Sgt. Brown đã đi đến kết luận đó.” Nhiều nỗ lực liên lạc với Brown đều không thành công.
Một vấn đề lớn với hệ thống của Geolitica, như nó được sử dụng ở Plainfield, là có một số lượng lớn các dự đoán so với một số lượng tội phạm tương đối nhỏ. Trong email năm 2021 gửi tới The Markup liên quan đến cuộc điều tra trước đây của chúng tôi về thuật toán của công ty, Giám đốc điều hành Geolitica Brian MacDonald đã viết rằng số lượng dự đoán được tạo ra trong từng khu vực là do cơ quan thực thi pháp luật sử dụng phần mềm đặt ra. Dữ liệu chúng tôi nhận được về Plainfield, nơi có dân số khoảng 54.000 người, có 80 dự đoán mỗi ngày chỉ cho một số loại tội phạm, trong khi số lượng tội phạm tối đa thuộc bất kỳ loại nào được báo cáo trong một ngày là 22 trong thời gian phân tích. Khối lượng dự đoán này nằm dưới mức trung bình của 107 dự đoán hàng ngày cho 37 khu vực pháp lý khác mà chúng tôi đã phân tích trong cuộc điều tra ban đầu của mình. Một số thành phố lớn hơn có nhiều dự đoán hơn, như Los Angeles, trung bình chỉ hơn một nghìn mỗi ngày. Nhưng có những thành phố nhỏ hơn Plainfield, như Niles, Illinois, nơi có khoảng một nửa dân số của Plainfield, với lượng dự đoán hàng ngày lớn—trung bình là 231.