跨平台 SKU 映射與統一指標庫:打造電商平台間「同款商品」的數據統一視角
核心目標
建立跨電商平台的商品資料庫,實現多站點同款商品的自動映射與關聯關係建立
將價格、庫存、銷量等核心運營指標進行格式與口徑統一,構建通用 KPI 指標池
以 SKU 為核心,搭建監控看板,並建立異常波動即時預警機制(如某站商品突然斷貨、價格劇烈波動等)
一、第一步:收集各站點商品基礎資料
以 Lazada、拼多多、Amazon 為例,透過 LuckData API 抓取商品詳細資訊,為後續同款匹配與指標聚合做準備。
Lazada 商品資料擷取
import requestsdef get_lazada_product_detail(site, item_id):
url = "https://luckdata.io/api/lazada-online-api/x3fmgkg9arn3"
params = {
"site": site, # 支援 "vn"、"th"、"ph"
"itemId": item_id
}
res = requests.get(url, params=params)
return res.json()
lazada_data = get_lazada_product_detail("vn", "2396338609")
print(lazada_data["data"]["title"], lazada_data["data"]["price"])
拼多多商品資料(模擬結構)
可透過自建爬蟲或使用 LuckData 提供的拼多多 API 接口獲取。
pdd_data = {"title": "小熊電熱飯盒雙層加熱蒸飯器",
"price": 129.0,
"sku_id": "pdd_948571",
"image": "https://cdn.example.com/pdd.jpg"
}
Amazon 商品資料(可接入 PA API 或爬蟲)
amazon_data = {"title": "Bear Electric Lunch Box, 2-Tier Food Steamer",
"price": 34.99,
"asin": "B09XY1234L",
"image": "https://cdn.example.com/amazon.jpg"
}
二、核心演算法:SKU 同款匹配與聚合
✅ 方法一:基於標題相似度進行同款判斷
利用文字相似度演算法如 FuzzyWuzzy
或 RapidFuzz
計算不同平台商品標題的相似程度。
from rapidfuzz import fuzzdef is_same_product(title_a, title_b, threshold=80):
score = fuzz.token_sort_ratio(title_a.lower(), title_b.lower())
return score > threshold
matched = is_same_product(lazada_data["data"]["title"], amazon_data["title"])
print("是否為同款商品:", matched)
為提高精度,可採用加權相似度計算,參考如下:
商品標題相似度(70%)
商品圖片哈希相似度(15%)
品牌/型號結構解析後的比對相似度(15%)
✅ 方法二:建立 SKU 標準庫與映射
為每個邏輯上的“同款商品”生成唯一 SKU ID,並將其對應到各平台的商品資料:
{"sku_id": "SKU_001",
"standard_title": "Bear Electric Lunch Box 2-Tier",
"platforms": {
"lazada_vn": {"item_id": "2396338609", "price": 135000, "url": "..."},
"pinduoduo": {"sku_id": "pdd_948571", "price": 129.0},
"amazon": {"asin": "B09XY1234L", "price": 34.99}
}
}
此結構可作為後續指標彙總、監控看板與預警機制的基礎資料模型。
三、統一指標:價格、庫存、銷量標準化
建立統一的跨平台指標資料表(每日定時更新)
SKU ID | 平台 | 商品標題 | 價格 | 庫存 | 銷量 | 日期 |
---|---|---|---|---|---|---|
SKU_001 | Lazada_vn | Bear Electric Lunch Box | 135000 | 54 | 320 | 2025-05-21 |
SKU_001 | Pinduoduo | 小熊電熱飯盒 | 129.0 | 68 | 480 | 2025-05-21 |
SKU_001 | Amazon | Bear Electric Lunch Box (EN) | 34.99 | 23 | 890 | 2025-05-21 |
? 樣板展示方式:搭建跨平台 SKU 維度看板
推薦使用以下工具快速構建可視化介面:
Streamlit + Pandas:構建靈活互動式 Web 看板
Google Data Studio:連接 Google Sheets 快速上線
PowerBI / Tableau:滿足企業級多維數據展示需求
四、預警機制與智慧監控
✅ 價格異常變動即時告警範例
實現邏輯:若某 SKU 在任一平台出現價格變動超過預設閾值(如15%),即觸發告警推送。
def price_alert(sku_id, price_today, price_yesterday):delta = abs(price_today - price_yesterday) / price_yesterday
if delta > 0.15:
return f"[警告] SKU {sku_id} 價格波動超過 15%"
告警可透過自動任務排程(如 Airflow / CRON)每日執行,並推送至飛書、Slack、郵件等渠道。
五、進階方向:從規則擴展到 AI 同款識別
階段 | 核心技術與重點 |
---|---|
V1 | 基於標題相似度 + 人工確認建立 SKU 映射 |
V2 | 引入圖片 hash 相似度 + 規則化品牌型號識別 |
V3 | 採用 AI 模型融合圖片與標題,進行商品匹配聚類 |
從文字相似度出發,逐步引入圖片與語義匹配模型,實現更準確的跨平台商品同款判斷與聚合。
✅ 總結回顧
利用 API 高效構建 Lazada / 拼多多 / Amazon 的商品資料集
透過文字與圖片相似度計算,構建統一的 SKU 資料庫
整合跨平台價格、銷量、庫存等運營指標,實現指標標準化
搭建 SKU 維度的監控看板與異常預警機制
可進一步應用於「同款價格對比」、「爆品監控」、「異常波動追蹤」等智慧化運營應用
Articles related to APIs :
Practical Guide to E-commerce Ad Creatives: Real-Time A/B Testing with API Data
API + AI: Building an LLM-Powered System for Automated Product Copy and Short Video Scripts
End-to-End Automation for Short Video E-commerce Monitoring (Powered by Luckdata API)
Shein, Temu & Lazada: Practical Guide to Cross-Border Fast Fashion Sourcing and Compliance