小智AI 首页

一、AI小智进行数据分析

发布于 2026年5月21日

一、AI小智进行数据分析



使用AI小智进行数据分析可以给我提供一个很好的

进行数据分析时可以使用对话智能体或相对应的智能体进行操作,同时也可以添加提示词和不添加提示词

下面进行展示:

a、不使用提示词进行数据分析

image.png


提问方式

帮我分析以下数据

销售订单明细表


输出结果

获取数据表数据1.1s获取 1 张数据表

分析计算26.0s执行 Python 脚本

【数据结果】\
总体规模:共 88 笔订单,总金额(含税)约 2.56 亿元,平均单笔订单金额高达 290.5 万元。\
业务结构分期收款业务占比 99.99%(85笔),普通销售仅 3 笔。\
客户分布:头部客户集中,Top 1 客户(中冶京城)贡献 5,159 万元,Top 5 客户合计贡献超 1.33 亿元。\
部门业绩技术商务部贡献 2.34 亿元,占比高达 91.6%,是主力。\
发货进度:已发货金额 2.08 亿元,整体发货率 81.44%,仍有约 4,746 万元未发货。\
时间趋势:业绩波动显著,2024年6月(5,253万)与2025年6月(3,383万)为高峰,2024年8月仅 72.9 万元。

【核心洞察】\
大客户与分期模式主导:业务高度依赖少数大客户及分期收款模式,虽然单笔金额大,但资金回笼周期长,且存在较高的客户集中风险。\
部门业绩极度不均:技术商务部承担了绝大部分业绩压力,其他部门(如市场拓展部、管理层)贡献微弱,销售结构失衡。\
交付履约存在瓶颈:近 19% 的订单金额尚未发货,可能受供应链、生产周期或客户验收影响,存在延迟交付风险,影响收入确认。\
业绩波动剧烈:月度销售额起伏较大,缺乏稳定的订单流入节奏,可能受项目制销售特性影响,导致现金流预测困难。

【改进建议】\
强化应收账款管理:针对分期收款业务,建立严格的账期监控与催收机制,提前评估大客户信用风险,保障资金链安全。\
优化交付与供应链协同:对未发货订单进行专项排查,建立“发货延迟预警系统”,优先处理高金额、长账期订单的交付,提升客户满意度。\
推动销售结构多元化:制定新客户拓展计划,降低对 Top 5 客户的依赖;同时赋能非核心销售部门,通过激励机制平衡各部门业绩贡献。\
平滑销售节奏:分析业绩低谷期(如8月)原因,提前布局季度/年度销售目标分解,通过促销活动或预售策略填补业绩空窗期。

10:20⏱ 1m 13s输入 12.5K · 输出 2.8Kqwen3.6-plus


b、使用提示词

image.png


提问方式

【角色设定】你是一位资深数据分析师,熟悉[行业/业务场景]金融商场的数据分析逻辑。 【数据说明】我将提供一份[格式,如CSV/Excel]数据,包含字段:[字段1, 字段2, 字段3...]。数据量约[X]行,已知问题:[如缺失值、重复记录、时间格式不统一等]。(可附前5行脱敏样本或数据字典) 【分析目标】请完成以下任务:

  1. 数据清洗与预处理建议
  2. 具体指标计算趋势分析用户分析归因分析
  3. 可视化建议统计分析
  4. 输出可运行的python[Python/R/SQL]代码,并附业务解读 【输出要求】按“步骤说明 → 代码 → 结果解读 → 业务建议”结构输出,使用Markdown格式。避免过度推断,仅基于提供字段分析。 【约束条件】不引入外部数据;代码需包含注释;若数据不足以支撑某分析,请明确说明并给出替代方案。

销售订单明细表


输出结果

Excel结构检查0.7s检查 Excel 结构

由于当前会话中未直接检测到对应的Excel数据文件(ID: da6233054ec111f186478cec4b636c59),我将基于您提供的字段说明与业务背景,为您构建一套完整、可复用的数据分析框架与Python代码模板。您只需将实际数据加载为 pandas.DataFrame即可直接运行。

以下按“步骤说明 → 代码 → 结果解读 → 业务建议”结构输出:


📊 一、数据清洗与预处理建议

问题类型 处理策略 业务意义
日期格式不统一 统一转换为 YYYY-MM-DD,提取年/月/周字段 支撑时间序列趋势分析
缺失值处理 金额/数量缺失用0填充或剔除;客户/部门缺失标记为“未知” 避免指标计算偏差
重复记录 销售订单号+行号去重,保留最新状态 防止销售额重复统计
状态过滤 仅保留 状态 == '已审核'/'已完成'的有效订单 聚焦真实业务发生额
币种与汇率 统一折算为本位币:本位币金额 = 原币金额 × 汇率 实现跨币种可比性
税额计算 若未直接提供:税额 = 不含税金额 × 税率 准确核算收入与税负

📈 二、分析指标与可视化建议

分析维度 核心指标 可视化建议
趋势分析 月度销售额、订单量、客单价趋势 折线图+双轴(量价分离)
用户分析 Top10客户贡献度、客户分类占比、复购率 条形图、饼图、漏斗图
归因分析 部门/职员业绩排名、业务类型结构、区域/渠道贡献 堆叠柱状图、树状图、热力图
统计分析 金额分布偏态、异常值检测(3σ/IQR) 直方图+箱线图

💻 三、可运行 Python 代码(含注释)

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

# 设置中文字体与绘图风格
plt.rcParams['font.sans-serif'] = ['SimHei', 'Arial Unicode MS']
plt.rcParams['axes.unicode_minus'] = False
sns.set_theme(style="whitegrid")

# ==========================================
# 1. 数据加载与清洗
# ==========================================
# 假设数据已加载为 df,实际使用时替换为 pd.read_excel('your_file.xlsx')
# df = pd.read_excel('销售订单明细表.xlsx')

def clean_data(df):
    """数据清洗与预处理"""
    # 1. 日期标准化
    df['日期'] = pd.to_datetime(df['日期'], errors='coerce')
    df.dropna(subset=['日期'], inplace=True)
    df['年'] = df['日期'].dt.year
    df['月'] = df['日期'].dt.month
    df['年月'] = df['日期'].dt.to_period('M')

    # 2. 状态过滤(仅分析有效订单)
    valid_status = ['已审核', '已完成', '已发货']
    df = df[df['状态'].isin(valid_status)]

    # 3. 去重(按订单号+行号)
    df.drop_duplicates(subset=['销售订单号', '行号'], keep='last', inplace=True)

    # 4. 金额统一折算(假设原字段为 金额, 税额, 汇率)
    # 若原始数据未提供金额,需根据 数量*单价 计算,此处假设已存在
    df['本位币销售额'] = df['金额'] * df['汇率']
    df['本位币税额'] = df['税额'] * df['汇率']

    # 5. 缺失值处理
    df['客户分类编码'].fillna('未分类', inplace=True)
    df['部门名称'].fillna('未知部门', inplace=True)
    df['职员姓名'].fillna('未知职员', inplace=True)

    return df

# df_clean = clean_data(df.copy())

# ==========================================
# 2. 趋势分析:月度销售走势
# ==========================================
def analyze_trend(df):
    monthly_sales = df.groupby('年月')['本位币销售额'].sum().reset_index()
    monthly_sales['年月'] = monthly_sales['年月'].astype(str)

    plt.figure(figsize=(10, 5))
    sns.lineplot(data=monthly_sales, x='年月', y='本位币销售额', marker='o', linewidth=2)
    plt.title('月度销售额趋势', fontsize=14)
    plt.xlabel('年月')
    plt.ylabel('销售额 (本位币)')
    plt.xticks(rotation=45)
    plt.tight_layout()
    plt.show()
    return monthly_sales

# ==========================================
# 3. 用户分析:客户贡献与分类结构
# ==========================================
def analyze_customer(df):
    # Top 10 客户
    top_customers = df.groupby('客户名称')['本位币销售额'].sum().nlargest(10).reset_index()

    # 客户分类占比
    cust_cat = df.groupby('客户分类编码')['本位币销售额'].sum().reset_index()
    cust_cat['占比'] = cust_cat['本位币销售额'] / cust_cat['本位币销售额'].sum()

    fig, axes = plt.subplots(1, 2, figsize=(14, 5))
    sns.barplot(data=top_customers, x='客户名称', y='本位币销售额', ax=axes[0])
    axes[0].set_title('Top 10 客户销售额')
    axes[0].tick_params(axis='x', rotation=45)

    axes[1].pie(cust_cat['占比'], labels=cust_cat['客户分类编码'], autopct='%1.1f%%', startangle=90)
    axes[1].set_title('客户分类销售占比')
    plt.tight_layout()
    plt.show()
    return top_customers, cust_cat

# ==========================================
# 4. 归因分析:部门/职员/业务类型贡献
# ==========================================
def analyze_attribution(df):
    # 部门业绩
    dept_perf = df.groupby('部门名称')['本位币销售额'].sum().sort_values(ascending=False).head(10)

    # 业务类型结构
    biz_type = df.groupby('业务类型')['本位币销售额'].sum().reset_index()

    fig, axes = plt.subplots(1, 2, figsize=(14, 5))
    dept_perf.plot(kind='bar', ax=axes[0], color='skyblue')
    axes[0].set_title('Top 10 部门销售额')
    axes[0].set_ylabel('销售额')

    sns.barplot(data=biz_type, x='业务类型', y='本位币销售额', ax=axes[1], palette='viridis')
    axes[1].set_title('各业务类型销售额')
    axes[1].tick_params(axis='x', rotation=30)
    plt.tight_layout()
    plt.show()
    return dept_perf, biz_type

# 执行分析(取消注释即可运行)
# df_clean = clean_data(df)
# trend_res = analyze_trend(df_clean)
# cust_res = analyze_customer(df_clean)
# attr_res = analyze_attribution(df_clean)

📝 四、结果解读与业务建议

🔍 结果解读框架

  1. 趋势分析:若月度销售额呈上升/下降趋势,结合季节性或促销活动判断是否为自然波动。若某月突增/突降,需下钻至订单明细排查大单或异常取消。
  2. 用户分析:Top 10 客户若贡献超 60% 销售额,说明客户集中度高,存在大客户依赖风险;客户分类占比可指导资源倾斜(如重点维护高价值分类)。
  3. 归因分析:部门/职员排名反映团队效能差异;业务类型结构揭示主力盈利模式,若低毛利业务占比过高,需优化产品组合。

💡 业务建议

分析结论 业务动作
销售额季节性波动明显 提前备货/排产,淡季推出促销套餐平滑产能
Top客户集中度过高 建立大客户专属服务机制,同时拓展中长尾客户分散风险
某部门/职员业绩持续偏低 开展专项培训或调整考核激励,排查流程瓶颈
低毛利业务类型占比上升 优化定价策略,推动高附加值产品交叉销售
异常订单/退货率高 加强订单审核与合同条款管理,建立售后预警机制

⚠️ 约束说明

  • 本代码基于您提供的字段逻辑编写,若实际数据中缺少 金额税额汇率 等字段,需先通过 数量 × 单价或财务接口补全。

  • 若数据量极大(>100万行),建议改用 polars或数据库聚合提升性能。

  • 如需生成可下载的 Excel 分析报告或对接具体数据文件,请上传文件后我将自动执行完整流水线。

10:28⏱ 1m 4s输入 3.9K · 输出 3.2Kqwen3.6-plus