CVPR 2024:圖像和視頻搜索與理解(檢索增強(qiáng)生成、多模態(tài)、嵌入等
YOLO11 自定義物體識(shí)別(版本11)
什么是OCM(以及為什么它如此重要)
揭秘PaliGemma 2:谷歌的高級(jí)視覺-語言模型
使用Llama 3.2-Vision模型搭建本地OCR應(yīng)用,輕松識(shí)別圖
用Llama 3.2-Vision提升OCR識(shí)別效果——Ollama的
PyTorch和MLX在蘋果芯片上的對(duì)比:卷積神經(jīng)網(wǎng)絡(luò)的實(shí)戰(zhàn)分析
Qwen2-VL-7B-Instruct:一款強(qiáng)大的圖文多模態(tài)AI模型
Qwen2-VL: 視頻理解模型,用于視頻理解的模型
NovelAI V4圖像生成模型預(yù)覽版發(fā)布——更強(qiáng)大的圖像創(chuàng)作工具來了
Kotaemon:本地機(jī)器上的開源圖形RAG界面
計(jì)算機(jī)基礎(chǔ)知識(shí)學(xué)習(xí):初學(xué)者必看教程
使用自定義的 Yolov10 和 Ollama (Llama 3) 來
Android上的AI視覺:CameraX圖像分析+ MediaPip
YOLOVision (YOLOv11) 推出:目前為止我們知道的關(guān)于
CVPR 2024 最佳論文綜述:全面概覽
30張超逼真AI圖像對(duì)比:Flux1.1 vs. SD3.5
如何在ComfyUI中使用差分?jǐn)U散技術(shù)實(shí)現(xiàn)更好的圖像修復(fù)
Flux:與Stable Diffusion和Midjourney競(jìng)爭(zhēng)
最適合的免費(fèi)開源AI工具:從圖片和文本提示生成視頻的那些神器
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號(hào)-11 京公網(wǎng)安備11010802030151號(hào)
購課補(bǔ)貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動(dòng)學(xué)習(xí)伙伴
掃描二維碼關(guān)注慕課網(wǎng)微信公眾號(hào)