欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 汽车 > 时评 > 学习指南(一)

学习指南(一)

2025/2/24 22:05:40 来源:https://blog.csdn.net/wwl412095144/article/details/143681317  浏览:    关键词:学习指南(一)

目录

工具

Pycharm&&Anaconda 

VSCode&&Anaconda

Jupyter notebook

Md扩展

Linux环境

论文

Latex

插图工具

Python

快乐编程

数据分析

快乐爬虫

生物信息库

RDkit

Openbabel

 PyBioMed

机器学习

机器学习入门

机器学习算法

Scikit-learn 

机器学习百科全书

深度学习

三个深度学习库

深度学习算法

团队的算法

后话


这里是一个相对比较全的学习指南。

这一篇主要是针对算法和代码,有点硬核。

请根据自己的任务来选择要学习的内容,针对性的学习。

工具

对于代码而言,首先要解决一下IDE的问题。环境方面我们用anaconda环境,IDE我们在VSCode和Pycharm(专业版)中二选一。

两者均未用过的,优先选Pycham,相对更加友好。

Pycharm&&Anaconda 

2024Pycharm IDE激活码【亲测有效】_pycharm密钥-CSDN博客(专业版pycharm下载)

超详细的pycharm+anaconda搭建python虚拟环境_pycharm anaconda环境搭建-CSDN博客(pycharm+anconda)

10个的常用PyCharm插件-CSDN博客(常见的插件,想用自己可以下)

VSCode&&Anaconda

Anaconda + VS Code 的安装与使用_anaconda vscode-CSDN博客(vscode+anaconda)

Jupyter notebook

用于学习和实验。Pycharm专业版可以直接用(直接创建.ipynb文件即可),Pycharm社区版用不了(这也就是为什么我们用专业版),VSCode下载一个Jupyter插件就可以用了。

Md扩展

Markdown 是一种轻量级的标记语言,它允许人们使用易读易写的纯文本格式编写文档。Markdown 的目标是实现“易读易写”,总而言之,就是写起来比word快,哈哈哈。

可以使用专业的markdown软件——typora,但是要钱,但是可以pojie,但是其实也没有太大必要,但是你想专业一点也可以。

可以直接使用Pycharm或VSCode,两者用法一样,直接下载markdown的相关插件即可。

下面是一些markdown的基础教程(感兴趣者可以看看):

手把手教会你使用Markdown【从入门到精通一篇就够了】-CSDN博客

Markdown语法教程(超详细)-CSDN博客

Linux环境

有代码任务以及需要与Linux服务器交互者,可以下载这个:

家庭/学校免费 - NetSarang Website

用于和Linux服务器交互,conda相关的指令以及Linux常见的指令也需要掌握。可以私信我拿到连接的私钥文件。

此外,VSCode和Pycharm(专业版才行,这是我们要专业版的第二个理由)可以直接SSH环境,具体可以查相关教程。

论文

Latex

Latex是一个专业的写作软件(markdown追求轻量,Latex追求专业,word追求直观的操作)。

写Latex的工具有很多。

用在线工具,点链接直接跳转:Overleaf, 在线LaTeX编辑器

可以在Pycharm或VSCode中做Latex的扩展,实现过程有点小麻烦,可以上网查。

可以直接用本地的工具,还挺多:实用的 LaTeX 编辑器_latex编辑器-CSDN博客

Latex的体系还挺大的(有一说一,个人感觉,比Python难),这里有一个还不错的文章:【论文写作】LaTeX学习笔记:一文入门LaTeX(超详细)-CSDN博客

当然,Latex远远不止这些,光是公式编辑就有一堆东西了。

插图工具

论文中的插图,一般是用PPT和PS。

我就不班门弄斧了。

有问题多请教师姐。

Python

快乐编程

Python是干生信的基本功,计划在该行业发展的自然要把它学好。

无python基础者可以上B站:

你觉得自己这辈子都学不会编程?超超超基础Python课程,3小时快速入门 【自学Python教程合集】【3小时快速入门Python】_哔哩哔哩_bilibili

有基础者可以看这个,下面这个是一个系列,下面有一堆东西,只是讲得有些简略,看不懂的再搜相关博客或者开源网站补补就OK了。学1-14就差不多了。

Python 基础(一):入门必备知识_python1基础学习-CSDN博客

下面这个挺全,挺适合学习和查漏补缺,虽然要9块9。上面写了100天,其实只是他一天写一篇,写了100多篇而已,而不是真的要学那么久。

100天精通Python_袁袁袁袁满的博客-CSDN博客

数据分析

首先就是数据分析三剑客:numpy pandas matplotlib。

粗鲁来讲,一个算向量和矩阵的,一个做表的,一个画图的。(之所以说“粗鲁”,因为它们三的能力可不止这么简单哈哈哈)

这三个东东总给人一种怎么学都学不完的感觉......学浅也可,学深也可......

三种学习思路,三选一即可

可以用菜鸟教程学:

NumPy 教程 | 菜鸟教程

Pandas 教程 | 菜鸟教程

Matplotlib 教程 | 菜鸟教程

如果花9块9买了之前那个专栏,也可以直接用那个来学。另外,这个专栏还有seaborn bokeh pyecharts等画图教程。

100天精通Python_袁袁袁袁满的博客-CSDN博客

也可以直接上B站,搜“数据分析三剑客”。

快乐爬虫

目的是和各种生信数据库和各种开源网站快乐的打交道。有这些常见的库:

requests:不管三七二十八,先得连上去。

re:不变应万变,粗暴但有用。

bs4:这个最容易上手,十分适合速成,但其实写起来慢。

lxml:主要是为了xpath,这个路径表达式可以直接精准制导,比bs4快多了。

selenium:可以模拟“屏幕前的人类”去点击,另外,觉得它过时了,derisionpage也行。

最好用过scrapy框架,虽然我们的项目大概率不会用,但是毕竟可以提高工程能力。

其他的如pyquery、多进程/线程、异步、写html都没太大必要。

可以在博客或者知乎上挨个挨个学(更快),嫌麻烦可以直接看这个:2023最新最全python爬虫教程【Scrapy框架+js逆向 +分布式爬虫】这还学不会,你来找樵夫!_哔哩哔哩_bilibili

生物信息库

知道常用的功能即可,没必要全都记住(毕竟随时可以查文档,也可以问ai,哈哈哈)

RDkit

最重要的生物信息库,重点要了解几种分子对象、分子指纹、化学性质等。

英文官网:The RDKit Documentation — The RDKit 2024.09.1 documentation

中文教程:RDKit中文教程 — RDKit 中文教程 2020.09 文档

Openbabel

感觉没必要了解太多,在我们已有的项目中这个库主要是用来做一个格式转化的。

英文官网:Open Babel - the chemistry toolbox — Open Babel openbabel-3-1-1 documentation

 PyBioMed

这个似乎用的更少,几乎不需要掌握。

官网:The PyBioMed Documentation — PyBioMed 1 documentation

机器学习

首先声明,学机器学习和学机器学习库是两码事。没有代码任务的成员可以学一下前者。

机器学习入门

机器学习入门,还是一如既往的首推吴恩达,只看第一和第二部分。第三部分的无监督学习我们用不着。(超爽中英!) 2024公认最好的【吴恩达机器学习】教程!附课件代码 Machine Learning Specialization_哔哩哔哩_bilibili

机器学习算法

传统机器学习算法无需精通,毕竟我们用的是深度学习算法。

了解常见的机器学习算法,可以看这个五分钟机器学习:五分钟机器学习的个人空间-五分钟机器学习个人主页-哔哩哔哩视频

也可以看我的博客():机器学习&深度学习_入门笔记_千233的博客-CSDN博客

Scikit-learn 

听说打过数模的对这个库都挺熟。

Python最重要的机器学习库,网上的教程很多,另外根据学习的深浅学习的思路也不一样,这篇文章还不错:全网最全的Scikit-Learn学习手册!-CSDN博客

也可以在实战中学(更推荐):阿里云天池大赛赛题解析-机器学习篇。这本书有多个案例,跟着做完一个就对scikit-learn就挺熟悉了。
链接:https://pan.baidu.com/s/1ouMWfEmPigQlwamy4t29TA?pwd=aaoe 
提取码:aaoe

机器学习百科全书

这个真的是一个百科全书,供查阅各种数学和算法基础,也可以用于帮助整理问答集。

博客目录与概览_个人博客系统查阅资料目录-CSDN博客

深度学习

核心部分。看完之前的吴恩达教程就可以开干了!

三个深度学习库

Pytorch和tensorflow两个至少掌握一个(推荐Pytorch,当然两个都会更好哈哈哈),deepchem必须会。

Pytorch可以先从B站的小土堆开始(虽然他重点讲的是卷积神经网络),教程中的环境搭建有点麻烦(不是教程的错,是因为真的麻烦),可以用实验室的环境:PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】_哔哩哔哩_bilibili

顺便这里也提一下Pytorch的官网:PyTorch

Deepchem用起来很方便,直接看官网即可:DeepChem

深度学习算法

如果想由下向上学好深度学习的话,一般我们都是看沐神(前排提醒,有难度!而且不低!)

视频里面xxx的详细代码实现不用看,直接看简洁版实现即可。代码细节没必要扣,理解意思即可。

看李沐的教程主要是看CNN系列和RNN系列,中间一些CV和NLP领域的知识我们自然不用看。另外,李沐的课程到了Transformer后难度会突然暴涨,对学习者极不友好。所以到Transformer及以后就不看了,看其他的教程。

视频:跟李沐学AI的个人空间-跟李沐学AI个人主页-哔哩哔哩视频

教材:《动手学深度学习》 — 动手学深度学习 2.0.0 documentation

团队的算法

如果认为没太大必要从下往上一步步学深度学习的话,可以直接看这里(虽然有些难度)。

团队项目中使用到的模型框架和深度学习算法在这里:

深度学习_千233的博客-CSDN博客

从Transformer开始写起,里面提到了团队所用到的算法以及学这些算法前需要学会的算法,在持续更新ing......

后话

学代码遇到不会的,一般可以这样做:

CSDN - 专业开发者社区

Kimi.ai - 会推理解析,能深度思考的AI助手

有能力可以多逛逛开源社区:

GitHub · Build and ship software on a single, collaborative platform · GitHub

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词