【導讀】這家咖啡廳裡,顧客待了多長時間,店員做了幾杯咖啡,在AI攝像頭下是一清二楚。百萬網友圍觀稱太可怕,馬斯克都震驚了。
我們生活的世界,越來越沒有隱私。
今天,網上流出的這段視頻,把許多人都嚇到了。
在一個咖啡店裡,每個顧客進店待了幾分鐘,每個服務員給顧客端了幾杯咖啡,都在視頻裡顯示得一清二楚!
視頻發布才十幾個小時,已經有100多萬網友圍觀了。
發布視頻的網友表示:這個概念展示了咖啡店是如何使用AI分析咖啡師和顧客的。請在咖啡店充分「享受」您的隱私吧。😂
另一位網友表示,這沒什麼大驚小怪的。作為消費者,你應該知道很多商店在你進去的一瞬間,就對你的一切瞭如指掌。
相比之下,「劍橋分析事件」只是小巫見大巫罷了。
(2018年,Facebook承認,這家英國數據分析公司在2016年違規獲得了5000萬Facebook用戶的信息,利用這些資料構建了一個軟件程序,從而預測和影響了投票箱結果,成功地幫助特朗普贏得總統大選。)
連馬斯克本人都現身評論區,連續留下了兩個驚嘆號。
如果你覺得在咖啡館裡用AI監視員工和顧客已經夠可怕了,現實就是,如果不考慮成本,空中可以有數千架無人機向監管部門發送實時跟踪數據,一切都會被跟踪和記錄。
甚至不需要專業部門,任何人都可以在業餘無人機上進行跟踪,因為目前的物體檢測和圖像識別技術實在太強大了。
要知道,幾年前在獨立顯卡上運行1080p串流時,最大容量也不過就是6個對象。
無處不在的「眼睛」
其中,已經有不少企業部署了非常隱蔽的策略,用於追踪消費者,一切都是通過AI和視頻源上的視覺識別來完成的。
比如沃爾瑪的智能零售實驗室內,IRL傳感器和攝像頭,讓工作人員對店裡的一切都瞭如指掌。
快餐店也採用了AI技術進行員工監督。這裡規定員工必須戴口罩,如果誰摘下口罩,經理就會立刻知道。
另外,我們的移動位置數據也在出售。
幾乎所有手機運營商,都在匿名向零售店售賣數據,可以說這是他們的一部分核心業務。
只要谷歌一下「運營商名稱+crowd insights(人群洞察)」,得到的結果就會令你驚訝。
「想知道特定時間內經過特定地點的人群數量是多少嗎?他們的年齡、收入狀況怎樣,有多少能夠成為潛在客戶?」
當然,「人群洞察」服務會強調:數據都是匿名的,收據收集的方式並不會暴露個人隱私。
有人表示:既然我的數據被收集了,我可以要求企業向我付費嗎?
關於企業中採用的攝像頭,評論區有人現身說法——
「我在體育場的後端安全攝像頭系統工作,我們向公眾發布的內容,只有實際數據的1/3。」
「這簡直就像在電影中,把自己的臉輸進去,系統就會識別出你在哪裡。」
而實現這一切,你只需要利用任意的攝像頭,安裝一個300美元的軟件,然後開始運行,直到磁盤空間用盡。
利與弊?
對此,AI諮詢專家Diego San Esteban分享了自己的觀點:
他認為,AI監測當然有不少優點,比如能持續監控員工的表現和生產力,讓管理人員更好地制定戰略。
另外,AI也可以提供客觀的績效數據,避免在評估中出現人為的偏見。
而缺點也不少,最為人詬病的自然是對員工隱私權的侵犯,並且還會在企業內產生不信任的氣氛,影響士氣和工作滿意度。
AI也無法充分理解工作進行的背景,還缺乏人類的同理心。
並且,它很可能會犯錯,受到訓練數據固有的偏見影響,這對員工是極度不公平的。
目標檢測算法
例如,給定一張城市街道的照片,目標檢測模型將返回圖像中所有不同物體的註釋或標籤列表:交通信號燈、車輛、道路標誌、建築物等。
這些標籤將包含每個物體的適當類別,比如「人」,以及一個「邊界框」,即完全包含物體的矩形區域。
目標檢測對於人類來說是一項關鍵任務:當進入新的房間或場景時,我們的第一反應是對其中的物體和人員進行視覺評估,然後理解它們。
與人類類似,目標檢測在使計算機理解和與視覺世界進行交互方面發揮著至關重要的作用,並且已經在很多行業中得到了廣泛的應用:
- 場所安全:
目標檢測模型可以幫助提高工作場所的安全性和安全性。例如,它們可以檢測敏感區域中可疑個體或車輛的存在。更具創意性的是,它可以確保工人使用個人防護裝備(PPE),如手套、頭盔或口罩。
- 社交媒體:
目標檢測模型可以幫助識別數字媒體中特定品牌、產品、標誌或人物的存在。廣告商可以利用這些信息來收集數據,並向用戶展示更相關的廣告。它還有助於自動化檢測和標記不當或禁止內容的過程。
- 質量控制:
目標檢測模型實現了對視覺數據的自動化審查。計算機和攝像頭可以實時分析數據,自動檢測和處理視覺信息並理解其重要性,從而減少了在需要進行持續視覺審查的任務中的人工干預。這在製造生產質量控制方面尤其有用。它不僅提高了效率,還可以檢測到人眼可能忽略的生產異常,從而防止潛在的生產中斷或產品召回。
首次達到66 AP,最強SOTA算法霸榜
在論文中,作者提出了一種新穎的協作混合分配訓練方案——Co-DETR,可以從多樣化的標籤分配方式中學習更高效且更有效的基於DETR的檢測器。
通過訓練多個平行輔助頭(受到一對多標籤分配的監督,如ATSS和Faster RCNN),全新的Co-DETR可以輕鬆提升端到端檢測器中編碼器的學習能力。
通過從這些輔助頭中提取正坐標來進行額外的定制正查詢,Co-DETR還可以提高解碼器中正樣本的訓練效率。
此外,在推理過程中,這些輔助頭會被丟棄,因此該方法不會給原始檢測器引入額外的參數和計算成本,同時也不需要手工非極大值抑制(NMS)。
論文地址:https://arxiv.org/abs/2211.12860v5
項目地址:https://github.com/Sense-X/Co-DETR
- 編碼器優化:
訓練方案可以通過訓練多個平行輔助頭,這些頭通過一對多的標籤分配進行監督,從而輕鬆提升端到端檢測器中編碼器的學習能力。
- 解碼器優化:
通過從這些輔助頭中提取正坐標來進行額外的定制正查詢,來改善解碼器的注意力學習。
- SOTA的性能:
搭載ViT-L(304M參數)的Co-DETR是第一個在COCO test-dev上實現66.0% AP的模型。
實驗結果顯示,在Swin-L骨幹網絡的基礎上,Co-DETR方法可以將現有的SOTA模型DINO-Deformable-DETR的性能,從58.5%提高到59.5%(在COCO驗證集上)。
在ViT-L骨幹網絡的支持下,Co-DETR在COCO test-dev上實現了66.0% AP,以及在LVIS驗證集上實現了67.9% AP。
此外,與以往方法相比,Co-DETR還在模型規模更小的情況下,取得了更好的性能。(新智元)
參考資料:
https://twitter.com/LinusEkenstam/status/1692602911518343502
https://twitter.com/lukasbenzlcom/status/1692543968829985124
https://www.chooch.com/blog/what-is-object-detection/
https://www.linkedin.com/posts/endritrestelica_ai-tech-activity-7098293527951851520-Mejy?utm_source=share&utm_medium=member_desktop