中药材数据分析与可视化系统
项目截图
登录
注册
首页
药材Top20
药材价格
产地占比
历史价格
新闻资讯
后台管理
一、项目概述
中药材数据分析与可视化系统是一个基于Django框架开发的专业Web应用,致力于对各类中药材数据进行全面、系统的采集、分析和可视化展示。本系统结合现代计算机技术与传统中医药知识,利用网络爬虫技术从专业药材网站获取丰富的数据资源,通过科学的数据清洗和处理手段,以直观的图表形式呈现药材的价格走势、产地分布、使用频率等多维度信息,为中药材研究、市场交易和临床使用提供全方位的数据支持和决策参考。
1.1 系统背景与意义
中药材作为中国传统医药的重要物质基础,拥有数千年的应用历史和丰富的理论体系。在现代医药体系中,中药材仍然扮演着不可替代的角色,其市场动态、价格波动、产地分布和功效研究等信息对于医药行业从业者、研究人员、教育工作者和消费者都具有极高的参考价值。
然而,目前中药材相关数据存在以下问题:
- 数据分散:中药材信息散布在各个网站、书籍和机构,难以系统获取
- 更新滞后:传统资料更新周期长,难以反映市场最新动态
- 形式单一:多以文字和表格为主,缺乏直观的可视化呈现
- 关联性弱:各类数据之间关联度低,难以进行多维度综合分析
- 获取困难:专业数据往往需要付费或特定渠道才能获取
本系统正是为解决这些问题而设计,通过现代信息技术手段将分散的中药材数据聚合为系统化的知识库,并以可视化的方式呈现,提升数据的可用性和分析价值。系统的建立对于中医药行业具有以下重要意义:
- 促进信息透明:提高中药材市场信息的透明度,减少信息不对称
- 辅助科学研究:为中药材研究提供数据支持,促进研究的科学性
- 指导市场交易:帮助从业者了解市场动态,指导采购和销售决策
- 服务临床实践:为医师提供药材选择参考,优化临床用药方案
- 传承中医文化:以现代技术手段传承和弘扬中医药文化
1.2 系统目标与愿景
1.2.1 核心目标
- 建立完整的中药材数据采集流程:实现对主要中药材门户网站数据的自动化、定期采集,确保数据的时效性和准确性
- 构建多维度数据分析框架:对中药材的价格、产地、功效、药方配伍等多个维度进行深入分析,挖掘数据价值
- 开发直观的可视化展示界面:利用现代数据可视化技术,以图表、地图等形式直观展示分析结果
- 提供用户友好的交互体验:设计简洁明了的用户界面,降低使用门槛,提升用户体验
- 构建系统化的中药材知识库:逐步积累并系统化整理中药材相关知识,形成有价值的数据资产
二、系统架构
2.1 技术栈
前端技术
- 基础技术:HTML5、CSS3、JavaScript
- 框架与库:Bootstrap、jQuery、Echarts(数据可视化)
- 响应式设计:适配不同尺寸的屏幕设备
后端技术
- 开发框架:Django 4.2.2
- 编程语言:Python 3.9.16
- 数据库:MySQL 8.0.26
- 开发模式:MVT(Model-View-Template)架构
- 数据分析:Python数据分析库(Pandas, NumPy)
- 网络爬虫:Requests, BeautifulSoup
2.2 系统模块
数据采集模块
- 实现对中药材网站数据的自动爬取
- 支持多种药材信息的采集,包括价格、产地、药方等
- 数据存储至CSV文件和MySQL数据库
数据分析模块
- 对采集的原始数据进行清洗和处理
- 使用统计学方法分析药材数据特征
- 提取有价值的数据结果用于可视化展示
用户管理模块
- 用户注册与登录功能
- 用户信息管理
- 权限控制与安全保障
数据展示模块
- 首页概览:系统功能导航和数据总览
- 药材Top20:展示使用频率最高的20种药材
- 药材价格:不同产地药材价格对比
- 产地占比:药材产地分布情况
- 历史价格:药材价格的历史走势
- 新闻资讯:药材相关市场动态和新闻
后台管理模块
- 系统数据管理
- 用户管理
- 内容更新与维护
2.3 数据库设计
系统采用MySQL数据库,主要包含以下数据表:
- 药方信息表(prescript):存储药材的处方信息
- 产地价格表(originprice):记录不同产地药材的价格
- 历史价格表(historyprice):记录药材价格的历史变化
- 供应产地表(originstatistics):统计药材的主要产地及供应情况
- 市场资讯表(info):存储药材相关的市场动态和新闻
三、系统功能
3.1 数据采集功能
系统通过reptile.py爬虫程序实现对中药材数据的自动采集,主要采集内容包括:
- 各种药材的药方配置与使用方法
- 不同产地药材的价格信息
- 药材历史价格变动数据
- 药材供应产地分布情况
- 药材市场资讯与新闻动态
爬虫程序具有以下特点:
- 支持自定义药材关键词搜索
- 自动识别药材ID并采集相关数据
- 数据分类整理并保存至CSV文件
- 支持数据自动入库
3.2 数据可视化功能
系统利用Echarts图表库实现数据的可视化展示,主要图表类型包括:
- 柱状图:展示药材价格对比和使用频率Top20
- 饼图:显示药材产地分布占比
- 折线图:展示药材历史价格走势
- 表格:展示药材市场资讯和详细数据
每个图表都具有交互功能,用户可以通过鼠标悬停、点击等操作获取更详细的数据信息。
3.3 用户功能
- 用户注册:新用户可通过注册页面创建账号
- 用户登录:已注册用户通过账号密码登录系统
- 数据浏览:用户可浏览系统中各类药材数据和图表
- 个人信息管理:用户可修改个人信息和账户设置
3.4 管理员功能
- 用户管理:查看、编辑和删除用户信息
- 数据管理:管理系统中的药材数据
- 内容审核:审核用户提交的信息
- 系统配置:调整系统参数和设置
四、系统启动教程
4.1 环境准备
基本环境要求
- Python 3.9或更高版本
- MySQL 8.0或更高版本
- 操作系统:Windows/Linux/MacOS
依赖软件
- Python开发环境(推荐PyCharm 2023.1)
- MySQL数据库及管理工具(如Navicat)
- Git(可选,用于代码克隆)
4.2 系统安装
步骤一:配置Python环境
- 使用PyCharm打开项目文件夹
- 创建并激活虚拟环境(可选但推荐)
python -m venv venv # Windows激活 venv\Scripts\activate # Linux/MacOS激活 source venv/bin/activate
- 安装项目依赖(可根据项目需要安装以下包)
pip install django==4.2.2 pip install mysqlclient pip install pandas pip install requests pip install beautifulsoup4 pip install jieba pip install sqlalchemy pip install numpy
步骤三:配置数据库
- 打开MySQL数据库管理工具(如Navicat)
- 创建名为"materialsdb"的新数据库(注意大小写)
CREATE DATABASE materialsdb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
- 选择以下两种方式之一导入数据:
方式1:直接导入现有数据(推荐)
- 在数据库管理工具中选择"materialsdb"数据库
- 导入项目根目录中的"materialsDB.sql"文件
- 等待导入完成
方式2:自定义数据采集
- 修改reptile.py文件中的数据库连接信息(用户名、密码等)
- 执行数据库迁移命令
cd djangoProject python manage.py makemigrations python manage.py migrate
- 运行爬虫采集数据
python reptile.py
步骤四:修改数据库连接设置
- 打开
djangoProject/djangoProject/settings.py
文件 - 找到DATABASES配置部分
- 根据你的MySQL配置修改以下内容:
DATABASES = {'default': {'ENGINE': 'django.db.backends.mysql','NAME': 'materialsdb','USER': '你的MySQL用户名','PASSWORD': '你的MySQL密码','HOST': '127.0.0.1','PORT': '3306',} }
4.3 系统启动
步骤一:创建管理员账号
- 在命令行中进入项目目录
cd Herbs_Analysis-main/Herbs_Analysis-main/djangoProject
- 创建超级管理员账号
python manage.py createsuperuser
- 按提示输入用户名、邮箱和密码
步骤二:启动Web服务器
- 在项目根目录执行
python manage.py runserver
- 看到以下输出表示启动成功:
Starting development server at http://127.0.0.1:8000/ Quit the server with CTRL-BREAK.
步骤三:访问系统
- 打开Web浏览器
- 访问前台页面:http://127.0.0.1:8000/
- 访问管理后台:http://127.0.0.1:8000/admin (使用之前创建的超级管理员账号登录)
4.4 常见问题解决
数据库连接错误
- 检查MySQL服务是否启动
- 确认数据库用户名和密码是否正确
- 确认数据库名称是否为"materialsdb"
依赖包安装失败
- 尝试使用国内镜像源:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- 逐个安装依赖包并解决错误
页面样式加载不正确
- 检查static文件夹是否包含所有静态资源
- 确认settings.py中STATIC_URL配置是否正确
- 清除浏览器缓存后重试
爬虫数据采集失败
- 检查网络连接是否正常
- 确认目标网站是否可访问
- 检查reptile.py中的URL是否有效
五、项目展望
本系统作为中药材数据分析与可视化的基础平台,未来可在以下方向继续扩展和完善:
- 数据源扩展:增加更多中药材相关网站的数据采集
- 分析维度拓展:加入药材功效分析、药材组合分析等更深入的数据挖掘
- 智能推荐系统:基于用户行为和药材特性实现个性化推荐
- 移动端适配:开发移动应用或进一步优化移动端体验
- API接口开放:提供数据接口,便于第三方应用调用
- 社区功能:增加用户交流和评论功能,促进知识共享
中药材数据分析与可视化系统不仅是一个技术平台,更是连接传统中医药知识与现代数据科学的桥梁。通过数据的力量,我们可以更好地理解和传承中医药文化,为中医药事业的发展贡献力量。