跨平台 SKU 映射與統一指標庫:打造電商平台間「同款商品」的數據統一視角
核心目標建立跨電商平台的商品資料庫,實現多站點同款商品的自動映射與關聯關係建立將價格、庫存、銷量等核心運營指標進行格式與口徑統一,構建通用 KPI 指標池以 SKU 為核心,搭建監控看板,並建立異常波動即時預警機制(如某站商品突然斷貨、價格劇烈波動等)一、第一步:收集各站點商品基礎資料以 Lazada、拼多多、Amazon 為例,透過 LuckData API 抓取商品詳細資訊,為後續同款匹配與指標聚合做準備。Lazada 商品資料擷取import requests
def get_lazada_product_detail(site, item_id):
url = "https://luckdata.io/api/lazada-online-api/x3fmgkg9arn3"
params = {
"site": site, # 支援 "vn"、"th"、"ph"
"itemId": item_id
}
res = requests.get(url, params=params)
return res.json()
lazada_data = get_lazada_product_detail("vn", "2396338609")
print(lazada_data["data"]["title"], lazada_data["data"]["price"])
拼多多商品資料(模擬結構)可透過自建爬蟲或使用 LuckData 提供的拼多多 API 接口獲取。pdd_data = {
"title": "小熊電熱飯盒雙層加熱蒸飯器",
"price": 129.0,
"sku_id": "pdd_948571",
"image": "https://cdn.example.com/pdd.jpg"
}
Amazon 商品資料(可接入 PA API 或爬蟲)amazon_data = {
"title": "Bear Electric Lunch Box, 2-Tier Food Steamer",
"price": 34.99,
"asin": "B09XY1234L",
"image": "https://cdn.example.com/amazon.jpg"
}
二、核心演算法:SKU 同款匹配與聚合✅ 方法一:基於標題相似度進行同款判斷利用文字相似度演算法如 FuzzyWuzzy 或 RapidFuzz 計算不同平台商品標題的相似程度。from rapidfuzz import fuzz
def is_same_product(title_a, title_b, threshold=80):
score = fuzz.token_sort_ratio(title_a.lower(), title_b.lower())
return score > threshold
matched = is_same_product(lazada_data["data"]["title"], amazon_data["title"])
print("是否為同款商品:", matched)
為提高精度,可採用加權相似度計算,參考如下:商品標題相似度(70%)商品圖片哈希相似度(15%)品牌/型號結構解析後的比對相似度(15%)✅ 方法二:建立 SKU 標準庫與映射為每個邏輯上的“同款商品”生成唯一 SKU ID,並將其對應到各平台的商品資料:{
"sku_id": "SKU_001",
"standard_title": "Bear Electric Lunch Box 2-Tier",
"platforms": {
"lazada_vn": {"item_id": "2396338609", "price": 135000, "url": "..."},
"pinduoduo": {"sku_id": "pdd_948571", "price": 129.0},
"amazon": {"asin": "B09XY1234L", "price": 34.99}
}
}
此結構可作為後續指標彙總、監控看板與預警機制的基礎資料模型。三、統一指標:價格、庫存、銷量標準化建立統一的跨平台指標資料表(每日定時更新)SKU ID平台商品標題價格庫存銷量日期SKU_001Lazada_vnBear Electric Lunch Box135000543202025-05-21SKU_001Pinduoduo小熊電熱飯盒129.0684802025-05-21SKU_001AmazonBear Electric Lunch Box (EN)34.99238902025-05-21? 樣板展示方式:搭建跨平台 SKU 維度看板推薦使用以下工具快速構建可視化介面:Streamlit + Pandas:構建靈活互動式 Web 看板Google Data Studio:連接 Google Sheets 快速上線PowerBI / Tableau:滿足企業級多維數據展示需求四、預警機制與智慧監控✅ 價格異常變動即時告警範例實現邏輯:若某 SKU 在任一平台出現價格變動超過預設閾值(如15%),即觸發告警推送。def price_alert(sku_id, price_today, price_yesterday):
delta = abs(price_today - price_yesterday) / price_yesterday
if delta > 0.15:
return f"[警告] SKU {sku_id} 價格波動超過 15%"
告警可透過自動任務排程(如 Airflow / CRON)每日執行,並推送至飛書、Slack、郵件等渠道。五、進階方向:從規則擴展到 AI 同款識別階段核心技術與重點V1基於標題相似度 + 人工確認建立 SKU 映射V2引入圖片 hash 相似度 + 規則化品牌型號識別V3採用 AI 模型融合圖片與標題,進行商品匹配聚類從文字相似度出發,逐步引入圖片與語義匹配模型,實現更準確的跨平台商品同款判斷與聚合。✅ 總結回顧利用 API 高效構建 Lazada / 拼多多 / Amazon 的商品資料集透過文字與圖片相似度計算,構建統一的 SKU 資料庫整合跨平台價格、銷量、庫存等運營指標,實現指標標準化搭建 SKU 維度的監控看板與異常預警機制可進一步應用於「同款價格對比」、「爆品監控」、「異常波動追蹤」等智慧化運營應用Articles related to APIs :Practical Guide to E-commerce Ad Creatives: Real-Time A/B Testing with API DataIntegrated Brand Sentiment Monitoring: Smart Consolidation and Early Warning System for Multi-Platform Keywords and Competitor ReviewsAPI + AI: Building an LLM-Powered System for Automated Product Copy and Short Video ScriptsEnd-to-End Automation for Short Video E-commerce Monitoring (Powered by Luckdata API)In-Depth Analysis of Pinduoduo Group Buying Data: How to Use APIs to Discover High-Converting Low-Price BestsellersShein, Temu & Lazada: Practical Guide to Cross-Border Fast Fashion Sourcing and Compliance
2025-05-23