圖像識別與以圖搜圖：打造淘寶商品圖像智能比對與搜尋系統

2025-05-16

本篇將深入探討如何結合圖像識別技術與淘寶商品數據，實現以圖搜圖（Image Search）與商品圖像相似度比對功能。透過深度學習模型與高效的圖像搜尋引擎，不僅可完成商品去重、視覺推薦、相似商品比對，還可支援智慧化的驗證與推薦系統，助力電商平台的資料清洗與推薦優化。

一、為什麼要建構以圖搜圖功能？

在電商平台中，商品圖像是使用者獲取商品資訊的首要視覺入口，承載著極高的信息密度與轉化潛力。構建圖像搜尋系統的核心目的包括：

去重識別：有效判斷是否存在重複商品圖像，可識別盜圖、搬運等行為，提升平台資料品質。
相似商品推薦：透過圖像的視覺相似度輔助推薦引擎，提供更貼近用戶審美的推薦結果。
用戶反查功能：支援用戶上傳一張商品圖，即可快速查找類似商品，提升使用體驗。
版權與風格管理：支援原創圖片溯源與監測盜圖行為，保護賣家創意資產，同時利於風格聚類與熱門設計識別。

二、系統架構概覽

整體圖像比對與搜尋系統可拆解為以下模組：

圖像採集：透過淘寶 API 或自動化爬蟲工具，收集商品主圖 URL。
圖像下載與預處理：將圖片轉為統一尺寸與格式，方便後續進行特徵提取。
圖像特徵提取：利用深度學習模型（如 ResNet50）將圖像轉換為特徵向量。
相似度計算與索引：使用向量檢索工具（如 Faiss 或 Milvus）構建高效相似圖檢索系統。
搜尋介面與服務 API：提供用戶圖像查詢的應用介面與後端服務。

三、圖像採集與預處理

首先，我們使用淘寶 API 擷取商品主圖的 URL，並進行統一尺寸轉換與格式標準化：

import requests
import os
from PIL import Image
from io import BytesIO
def download_image(image_url, save_path):
response = requests.get(image_url)
img = Image.open(BytesIO(response.content)).convert("RGB")
img = img.resize((224, 224))  # 標準化尺寸
img.save(save_path)
# 範例調用
download_image("https://example.com/image1.jpg", "images/image1.jpg")

圖像尺寸統一為 224x224 是為了適配大多數預訓練模型的輸入要求，亦有利於加快特徵提取與計算。

四、圖像特徵提取（基於 ResNet50）

我們選擇 PyTorch 中的 ResNet50 模型作為圖像編碼器，擷取深度特徵向量：

import torch
import torchvision.models as models
import torchvision.transforms as transforms
model = models.resnet50(pretrained=True)
model.eval()
model = torch.nn.Sequential(*list(model.children())[:-1])  # 移除最後分類層
transform = transforms.Compose([
transforms.Resize((224, 224)),
transforms.ToTensor(),
])
def extract_feature(image_path):
img = Image.open(image_path).convert("RGB")
img_tensor = transform(img).unsqueeze(0)
with torch.no_grad():
feature = model(img_tensor)
return feature.squeeze().numpy()
# 範例
vec = extract_feature("images/image1.jpg")

此模型可產出 2048 維的向量表徵圖像語義特徵，適合用於相似度計算與聚類分析。

五、建構圖像向量檢索系統（Faiss）

我們使用 Facebook 開源的 Faiss 工具進行向量檢索，支援快速比對大規模資料集中的圖像特徵：

import faiss
import numpy as np
# 假設已有多張圖片的特徵向量
features = np.array([...])  # shape: (n_samples, 2048)
index = faiss.IndexFlatL2(2048)
index.add(features)
# 查詢
query_vec = extract_feature("query.jpg").reshape(1, -1)
D, I = index.search(query_vec, k=5)  # 取出最相似的前5張圖片索引

其中 I 為檢索到的相似圖片索引，D 為距離值。透過索引與商品資料表關聯，即可返回對應商品資訊。

六、提供搜尋服務（FastAPI 範例）

我們使用 FastAPI 构建簡易後端服務，支援圖像上傳與即時查詢：

from fastapi import FastAPI, UploadFile, File
import uvicorn
app = FastAPI()
@app.post("/search_by_image/")
async def search(file: UploadFile = File(...)):
contents = await file.read()
with open("temp.jpg", "wb") as f:
f.write(contents)
vec = extract_feature("temp.jpg").reshape(1, -1)
D, I = index.search(vec, k=5)
return {"result_indexes": I.tolist(), "distances": D.tolist()}
# 啟動指令：uvicorn main:app --reload

此介面可供前端或移動端調用，實現實時以圖搜尋功能，提升用戶互動效率。

七、實際應用場景拓展

圖像檢索系統可延伸出多種應用模組，包括但不限於：

相似商品推薦系統：與內容推薦或協同過濾結合，輸出更符合用戶視覺偏好的推薦結果。
AI 驗圖系統：判斷商品圖是否為已有圖像重複或仿冒，提升商品審核自動化程度。
圖片聚類與主題識別：基於圖像特徵聚類，可應用於風格分析、熱賣商品視覺主題提煉與庫存分類。

八、效能與部署建議

為保證實時性與系統穩定性，建議考慮以下優化策略：

使用 Faiss GPU 版本 以提升處理速度，特別適合大規模圖片集。
將圖片特徵 離線預計算並存入向量資料庫（如 Milvus），避免重複計算。
採用 增量更新機制：定時抽取新商品圖並更新索引，確保資料新鮮度。
對於熱門圖片查詢，可透過 記憶體快取（如 Redis） 提升查詢效能與反應速度。

結語

以圖搜圖技術已成為電商智慧化的重要組件，透過結合深度學習與向量搜尋技術，不僅可提升用戶體驗，也大幅強化平台在推薦、審核、版權管理等環節的自動化能力。未來篇章將介紹如何結合自然語言處理（NLP）技術解析商品評論，挖掘用戶情緒與需求，進一步優化商品設計與行銷策略。

Articles related to APIs :

如您需要 Taobao API 可聯係我們：support@luckdata.com