跨平台 SKU 映射與統一指標庫:打造電商平台間「同款商品」的數據統一視角

核心目標

  • 建立跨電商平台的商品資料庫,實現多站點同款商品的自動映射與關聯關係建立

  • 將價格、庫存、銷量等核心運營指標進行格式與口徑統一,構建通用 KPI 指標池

  • 以 SKU 為核心,搭建監控看板,並建立異常波動即時預警機制(如某站商品突然斷貨、價格劇烈波動等)

一、第一步:收集各站點商品基礎資料

Lazada、拼多多、Amazon 為例,透過 LuckData API 抓取商品詳細資訊,為後續同款匹配與指標聚合做準備。

Lazada 商品資料擷取

import requests

def get_lazada_product_detail(site, item_id):

url = "https://luckdata.io/api/lazada-online-api/x3fmgkg9arn3"

params = {

"site": site, # 支援 "vn"、"th"、"ph"

"itemId": item_id

}

res = requests.get(url, params=params)

return res.json()

lazada_data = get_lazada_product_detail("vn", "2396338609")

print(lazada_data["data"]["title"], lazada_data["data"]["price"])

拼多多商品資料(模擬結構)

可透過自建爬蟲或使用 LuckData 提供的拼多多 API 接口獲取。

pdd_data = {

"title": "小熊電熱飯盒雙層加熱蒸飯器",

"price": 129.0,

"sku_id": "pdd_948571",

"image": "https://cdn.example.com/pdd.jpg"

}

Amazon 商品資料(可接入 PA API 或爬蟲)

amazon_data = {

"title": "Bear Electric Lunch Box, 2-Tier Food Steamer",

"price": 34.99,

"asin": "B09XY1234L",

"image": "https://cdn.example.com/amazon.jpg"

}

二、核心演算法:SKU 同款匹配與聚合

✅ 方法一:基於標題相似度進行同款判斷

利用文字相似度演算法如 FuzzyWuzzyRapidFuzz 計算不同平台商品標題的相似程度。

from rapidfuzz import fuzz

def is_same_product(title_a, title_b, threshold=80):

score = fuzz.token_sort_ratio(title_a.lower(), title_b.lower())

return score > threshold

matched = is_same_product(lazada_data["data"]["title"], amazon_data["title"])

print("是否為同款商品:", matched)

為提高精度,可採用加權相似度計算,參考如下:

  • 商品標題相似度(70%)

  • 商品圖片哈希相似度(15%)

  • 品牌/型號結構解析後的比對相似度(15%)

✅ 方法二:建立 SKU 標準庫與映射

為每個邏輯上的“同款商品”生成唯一 SKU ID,並將其對應到各平台的商品資料:

{

"sku_id": "SKU_001",

"standard_title": "Bear Electric Lunch Box 2-Tier",

"platforms": {

"lazada_vn": {"item_id": "2396338609", "price": 135000, "url": "..."},

"pinduoduo": {"sku_id": "pdd_948571", "price": 129.0},

"amazon": {"asin": "B09XY1234L", "price": 34.99}

}

}

此結構可作為後續指標彙總、監控看板與預警機制的基礎資料模型。

三、統一指標:價格、庫存、銷量標準化

建立統一的跨平台指標資料表(每日定時更新)

SKU ID

平台

商品標題

價格

庫存

銷量

日期

SKU_001

Lazada_vn

Bear Electric Lunch Box

135000

54

320

2025-05-21

SKU_001

Pinduoduo

小熊電熱飯盒

129.0

68

480

2025-05-21

SKU_001

Amazon

Bear Electric Lunch Box (EN)

34.99

23

890

2025-05-21

? 樣板展示方式:搭建跨平台 SKU 維度看板

推薦使用以下工具快速構建可視化介面:

  • Streamlit + Pandas:構建靈活互動式 Web 看板

  • Google Data Studio:連接 Google Sheets 快速上線

  • PowerBI / Tableau:滿足企業級多維數據展示需求

四、預警機制與智慧監控

✅ 價格異常變動即時告警範例

實現邏輯:若某 SKU 在任一平台出現價格變動超過預設閾值(如15%),即觸發告警推送。

def price_alert(sku_id, price_today, price_yesterday):

delta = abs(price_today - price_yesterday) / price_yesterday

if delta > 0.15:

return f"[警告] SKU {sku_id} 價格波動超過 15%"

告警可透過自動任務排程(如 Airflow / CRON)每日執行,並推送至飛書、Slack、郵件等渠道。

五、進階方向:從規則擴展到 AI 同款識別

階段

核心技術與重點

V1

基於標題相似度 + 人工確認建立 SKU 映射

V2

引入圖片 hash 相似度 + 規則化品牌型號識別

V3

採用 AI 模型融合圖片與標題,進行商品匹配聚類

從文字相似度出發,逐步引入圖片與語義匹配模型,實現更準確的跨平台商品同款判斷與聚合。

✅ 總結回顧

  • 利用 API 高效構建 Lazada / 拼多多 / Amazon 的商品資料集

  • 透過文字與圖片相似度計算,構建統一的 SKU 資料庫

  • 整合跨平台價格、銷量、庫存等運營指標,實現指標標準化

  • 搭建 SKU 維度的監控看板與異常預警機制

  • 可進一步應用於「同款價格對比」、「爆品監控」、「異常波動追蹤」等智慧化運營應用

Articles related to APIs :