数据统计与分析

概述

掌上意见箱作为智能意见收集管理平台，其核心价值之一在于对收集到的海量意见数据进行深度统计与分析，以洞察民意、发现问题、辅助决策。本文档面向开发者和高级用户，详细介绍平台的数据统计能力、相关接口及高级分析应用。

核心统计维度

平台提供多维度、可定制的数据统计，主要涵盖以下方面：

基础概况统计
- 意见总数：指定时间范围内收集到的所有意见数量。
- 参与人数：去重后的意见提交者数量。
- 渠道分布：意见通过不同渠道（如Web端、移动端H5、小程序、API接入）提交的占比。
- 时间趋势：意见提交量的按日、按周、按月变化曲线。
内容与情感分析
- 主题分类分布：基于自然语言处理（NLP）自动将意见归类到预设或自定义主题（如“产品功能”、“服务质量”、“操作流程”）的统计。
- 情感倾向分析：分析意见文本的情感极性（正面、中性、负面）及其比例。
- 关键词云与高频词：提取意见中的高频词汇和短语，形成可视化关键词云。
处理流程统计
- 处理状态分布：意见处于“待处理”、“处理中”、“已回复”、“已关闭”等状态的数量与比例。
- 响应与处理时长：平均首次响应时间、平均处理完成时间等效率指标。
- 责任部门/人分布：意见被分配至不同处理部门或负责人的分布情况。
用户参与度分析
- 活跃用户分析：提交意见频次较高的用户识别。
- 反馈闭环满意度：用户对处理结果的评价（如星级评分、满意/不满意）统计。

API 接口调用

开发者可以通过 RESTful API 获取原始数据或聚合统计结果，以便集成到自有系统或进行二次分析。

获取统计摘要

GET /api/v1/stats/summary
Authorization: Bearer {your_access_token}

请求参数（Query Parameters）:

参数名	类型	必填	说明
`start_date`	string	否	统计开始日期，格式 YYYY-MM-DD，默认30天前
`end_date`	string	否	统计结束日期，格式 YYYY-MM-DD，默认今天
`category_id`	integer	否	按意见分类ID筛选

响应示例 (200 OK):

{
  "code": 0,
  "data": {
    "total_suggestions": 12543,
    "total_participants": 8921,
    "avg_sentiment_score": 0.72,
    "channel_distribution": {
      "web": 35,
      "mobile_h5": 40,
      "miniapp": 20,
      "api": 5
    },
    "status_distribution": {
      "pending": 100,
      "in_progress": 250,
      "replied": 12000,
      "closed": 193
    }
  },
  "message": "success"
}

导出原始意见数据

如需进行更复杂的自定义分析，可导出详细的原始数据。

GET /api/v1/suggestions/export
Authorization: Bearer {your_access_token}

请求参数（Query Parameters）:

参数名	类型	必填	说明
`start_date`	string	否	导出开始日期，格式 YYYY-MM-DD
`end_date`	string	否	导出结束日期，格式 YYYY-MM-DD
`format`	string	否	导出格式，支持 `json` 或 `csv`，默认为 `json`

响应说明:

成功时，将直接返回文件流（CSV文件）或包含详细记录的JSON数组。
数据量较大时，建议使用分页参数或联系管理员获取批量导出服务。

数据可视化与仪表盘

平台内置可视化仪表盘，高级用户可通过界面直接配置：

自定义报表：在管理后台的“数据分析”模块，通过拖拽方式选择统计维度（如时间、分类、渠道）和指标（如数量、占比、平均值），生成实时图表（折线图、柱状图、饼图）。
仪表盘保存与分享：可将配置好的仪表盘保存为模板，并生成分享链接给团队成员，确保数据洞察同步。
定时报告：可设置每日、每周或每月定时将关键统计指标通过邮件或Webhook发送给指定人员。

高级分析场景示例

场景一：结合业务数据的深度分析

开发者可将导出的意见数据与公司内部业务数据（如订单数据、用户画像、App活跃数据）在数据仓库（如ClickHouse, BigQuery）或分析工具（如Python Pandas, R）中进行关联分析。

示例代码 (Python Pandas):

import pandas as pd

## 假设已从平台导出意见数据 suggestions_df，从业务系统导出用户数据 users_df
suggestions_df = pd.read_csv('suggestions_export.csv')
users_df = pd.read_csv('user_profiles.csv')

## 关联分析：高价值用户的意见倾向
merged_df = pd.merge(suggestions_df, users_df, on='user_id', how='left')
## 分析VIP用户（假设 user_level 为 3）提交的意见情感分布
vip_sentiment = merged_df[merged_df['user_level'] == 3]['sentiment'].value_counts()
print(vip_sentiment)

场景二：趋势预警与监控

通过API定时拉取近期负面情感意见的比例和数量，当超过设定的阈值时，自动触发告警（如发送消息至钉钉/企业微信群、创建工单）。

## 伪代码示例
import requests
import time
from alert_system import send_alert

while True:
    stats = get_sentiment_stats() # 调用获取情感统计的API
    negative_ratio = stats['negative_count'] / stats['total_count']
    
    if negative_ratio > 0.15: # 假设阈值是15%
        message = f"负面意见比例告警：当前为 {negative_ratio:.2%}，请及时关注！"
        send_alert(message)
    
    time.sleep(3600) # 每小时检查一次

最佳实践与性能建议

数据缓存：对于实时性要求不高的汇总数据，建议在客户端或中间层进行缓存，避免频繁调用API。
异步导出：导出全量历史数据时，建议使用平台提供的异步任务接口，避免请求超时。
增量同步：在与自有系统集成时，建议根据意见的 created_at 或 updated_at 时间戳进行增量数据拉取，提升效率。
关注数据安全：通过API导出的数据可能包含用户反馈的原文，请妥善保管并遵守相关数据隐私法规。

总结

掌上意见箱提供了从基础统计到高级分析的全套数据能力。通过灵活运用管理后台的可视化工具和开放的API接口，开发者和高级用户能够充分挖掘意见数据的价值，将其转化为可行动的洞察，从而提升产品、服务与运营水平。

请注意：本文档基于通用功能描述，具体API端点、参数及响应格式请以平台开发者中心提供的最新官方文档为准。