回復(fù) 鞏漢林 : 重度互聯(lián)網(wǎng)愛(ài)好者們福來(lái)了!你是否遇到過(guò)這情況:一個(gè)梗圖尋遍全都還沒(méi)找到。現(xiàn)在外網(wǎng)位小哥搞出了一個(gè)互聯(lián)規(guī)模的 Meme 搜索引擎,庫(kù)里有近兩千萬(wàn)梗圖,涵蓋各種小眾文。檢索關(guān)鍵詞,或者上相似圖片,結(jié)果就能秒!若遇到 Meme 庫(kù)里沒(méi)有的梗圖,還可共上傳。網(wǎng)友六年都沒(méi)找的梗圖,在這個(gè)小哥的站上 2 分鐘就找到了。然鵝這樣一個(gè)秒秒鐘梗圖的背后的裝置確實(shí)嬸兒的:(這不會(huì)有點(diǎn)簡(jiǎn)陋了吧)這時(shí)候可能有盆友好奇,這個(gè)粗糙裝置是如何做到快速檢梗圖的?那不妨一起來(lái)看這個(gè)“Meme 搜索引擎”是如何搭建的~感來(lái)自 iPhone 圖片識(shí)別要編寫(xiě)一個(gè) Meme 搜索引擎,最重要也是最先面臨的教山個(gè)題就是:如何準(zhǔn)確識(shí)別圖中的文字信息?用專一點(diǎn)的話來(lái)講就是:如擁有一個(gè)可伸縮的 OCR(光學(xué)字符識(shí)別 )?OCR 的解決方案倒是有現(xiàn)成的,不過(guò)現(xiàn)有禺?么就是遇到比較抽象的圖識(shí)別效果不太好,要就是太貴。舉個(gè)簡(jiǎn)單的子,比如說(shuō)用 Tesseract OCR 來(lái)提取圖像中的文字,測(cè)時(shí),只能用非常標(biāo)準(zhǔn)的體和配色方案識(shí)別 Meme 圖,不然的話就會(huì)出現(xiàn)下面這種情況。共工原圖:這是識(shí)別出來(lái)的字:30 BLUE man41;? S4-5?’?ew/ — V [IL ‘ . “,2; g” .’Sj /B”f;T”EArmDand [red] mvslmunlm: sawmillsemmmmmm不過(guò)靈感很快就來(lái)了,小哥偶然間關(guān)于 iPhone 給別人發(fā)一個(gè)驗(yàn)證碼圖片時(shí)。這是驗(yàn)碼圖片:這是復(fù)制過(guò)來(lái)文字:并且 iPhone 的這個(gè)功能已經(jīng)在 iOS Vision 框架中公開(kāi)了,可伸縮 OCR 的問(wèn)題這不就有解決辦法了嘛~不過(guò)關(guān) Vision 框架目前還沒(méi)有現(xiàn)成的開(kāi)源代插件,只能自己寫(xiě)了,體代碼小哥目前還沒(méi)公。BUT,小哥還是總結(jié)了一下自己寫(xiě)代碼緣婦的法經(jīng)驗(yàn),而且是針對(duì)一從未用 Swift 寫(xiě)過(guò)任何正經(jīng)東西的小白遇事不決 Google 之Github 上逆向工程各種 Swift 回購(gòu)協(xié)議請(qǐng)教懂 iOS 的朋友解決 Xcode 問(wèn)題……最終東拼西湊,搞出了一個(gè)可行解決方案:iOS Vision OCR 服務(wù)器,僅在一部 iPhone 上就能運(yùn)行。識(shí)別文字信息這士敬搞定了,下來(lái)就輪到搜索環(huán)節(jié)了相較于上一趴,這部分簡(jiǎn)單多了。小哥用的是 ElasticSearch(已開(kāi)源)和 Postgres。ElasticSearch 擁有多節(jié)點(diǎn)能夠有效避免障的發(fā)生,并且能夠在證速度的情況下容納數(shù)萬(wàn)個(gè) Meme,不過(guò)這都是在犧牲了可靠性之得到的。而 Postgres 能夠保證搜索結(jié)果的可靠性,但在豎亥過(guò)百萬(wàn)張圖片的范圍時(shí),會(huì)變得特別慢。一個(gè)能證速度,一個(gè)能保證質(zhì),那……Done!在這其中,小哥用到了 PGSync,它是一件中間件,可以用于同步從 Postgres 到 Elasticsearch / OpenSearch 的數(shù)據(jù),具體的搜索流程如下:到這里整個(gè)搜索引擎的搭建已見(jiàn)雛形,但還沒(méi)結(jié)束…視頻 Meme 也能支持因?yàn)?Meme 不僅僅靠梗圖來(lái)傳遞,有時(shí)還會(huì)有視頻。這倒也簡(jiǎn),直接將視頻分割成截集,之后就能像普通的 Meme 圖一樣被識(shí)別了。具體來(lái)說(shuō),小哥編了一個(gè)小型微服務(wù),通 ffmpeg(它可以執(zhí)行音頻和視頻多種阿女的錄影、轉(zhuǎn)換、串流功),從視頻中截取 10 個(gè)均勻間隔的圖片。然后將截圖文件發(fā)送到 iPhone OCR 服務(wù),最終視頻文件中會(huì)每個(gè)屏幕截圖 OCR 后的結(jié)果集。不過(guò)擁有頻檢索功能后,毫無(wú)疑 OCR 服務(wù)的負(fù)載就重了,一個(gè)視頻 OCR 的工作量幾乎是一般梗圖的 10 倍。雖然說(shuō) OCR 應(yīng)用服務(wù)器的速度很快,但也禁淑士住樣薅,于是 iOS OCR 服務(wù)升級(jí)了(多加幾臺(tái)手機(jī))美山于是最終裝置就變開(kāi)頭圖中的那了。最終具體的流程圖哥也貼心地給出來(lái)了:哥的這個(gè) Meme 搜索引擎出來(lái)之后,網(wǎng)友也都直呼太棒了。當(dāng)然有網(wǎng)友給出了一些建議認(rèn)為當(dāng)前的搜索引擎太本化了,而很多 Meme 圖本身就沒(méi)多少文字,更多時(shí)候都是“意會(huì)。對(duì)此,小哥本人也作了回應(yīng),稱之后還會(huì)繼優(yōu)化搜索引擎:考慮將像轉(zhuǎn)換為描述的文本…不過(guò)值得一提的是,目這個(gè)搜索引擎還不太支中文,中文的梗圖搜索果不是很好,但既然小已經(jīng)將構(gòu)建方法給出來(lái),就期待一波萬(wàn)能的網(wǎng)吧。(手動(dòng)狗頭)如果對(duì)這個(gè)項(xiàng)目感興趣的話可以戳下文鏈接~傳送:https://findthatmeme.com/參考鏈接:https://findthatmeme.com/blog/2023/01/08/image-stacks-and-iphone-racks-building-an-internet-scale-meme-search-engine-Qzrz7V6T.html本文來(lái)自微信公眾號(hào):量子位 (ID:QbitAI),作者:Pine
回復(fù) 淺川梨奈 : IT之家 1 月 23 日消息,世界移動(dòng)信大會(huì)(MWC)將于今年 2 月 27 日至 3 月 3 日在西班牙巴塞羅那舉行, 1 月份的 CES 一樣,MWC 是智能手機(jī)制造商展創(chuàng)新產(chǎn)品的地。雖然一加還有確認(rèn)將參?MWC,但爆料者 Max Jambor 透露了一些關(guān)于公司計(jì)劃的細(xì)。按照 Jambor 的說(shuō)法,一加將在即到來(lái)的 MWC 2023 上發(fā)布一款概念機(jī),將被稱為 OnePlus Concept Two。然而,關(guān)于該設(shè)的細(xì)節(jié)目前仍很少。但既然一款概念產(chǎn)品預(yù)計(jì)該機(jī)將包一些突破性的術(shù)和行業(yè)首創(chuàng)功能。一加曾三年前在 CES 上展示了一加概念手機(jī) OnePlus Concept One,該機(jī)是與汽車制造邁凱倫合作開(kāi)的,首次將一被應(yīng)用于飛機(jī)跑車玻璃上的致變色技術(shù)應(yīng)到手機(jī)上,「隱式后攝」應(yīng)而生,整個(gè)后部分從不透明透明的轉(zhuǎn)變時(shí)大約是 0.7 秒,這也是整部手機(jī)最「概」的地方。外部分,整部手被邁凱倫超級(jí)車中所使用的革所包覆,看去非常炫酷。憾的是,該機(jī)未進(jìn)入市場(chǎng)。隔三年,OnePlus Concept Two 將帶來(lái)哪些創(chuàng)新技術(shù)值期待?
回復(fù) 宣萱 : IT之家 1 月 15 日消息,KDE 項(xiàng)目團(tuán)隊(duì)于今天推出 KDE Frameworks 5.102 版本更新。本次新中最值得注的改進(jìn)就,KDE Connect 應(yīng)用中支持傳輸超過(guò) 2GB 大小的文件。IT之家小課堂:KDE Connect 應(yīng)用是一款允用戶在移動(dòng)備和電腦之傳輸文件的用,也支持收通知、控媒體播放器功能。KDE Frameworks 5.102 另一個(gè)值得注的改進(jìn)就 Meta Key 等修改鍵。這個(gè)化將出現(xiàn)在將到來(lái)的 KDE Plasma 5.27 桌面環(huán)境系列中,KDE 開(kāi)發(fā)者希望取代 KWin 窗口和復(fù)合管理中奇怪的舊改器鍵處理式,這樣你可以直接將改器鍵分配 Kickoff 或 Overview。KDE Frameworks 5.102 更新還支持在打開(kāi)”對(duì)話的目錄選擇字段中,使其完整文件徑訪問(wèn)文件在重啟過(guò)程支持“Always use Touch Mode”;在基于 Kirigami 的應(yīng)用程序中,支使用 Esc 鍵或通過(guò)點(diǎn)擊視圖中的暗區(qū)關(guān)閉側(cè)屜。KDE Frameworks 5.102 還改進(jìn)了 Plasma Wayland 會(huì)話,修復(fù)了多個(gè)和粘相關(guān)的問(wèn)題這次 KDE Frameworks 的更新包含超過(guò) 140 個(gè)變化,所以請(qǐng)查看發(fā)公告頁(yè)面上完整更新日以了解更多節(jié)?