目录
工具
Pycharm&&Anaconda
VSCode&&Anaconda
Jupyter notebook
Md扩展
Linux环境
论文
Latex
插图工具
Python
快乐编程
数据分析
快乐爬虫
生物信息库
RDkit
Openbabel
PyBioMed
机器学习
机器学习入门
机器学习算法
Scikit-learn
机器学习百科全书
深度学习
三个深度学习库
深度学习算法
团队的算法
后话
这里是一个相对比较全的学习指南。
这一篇主要是针对算法和代码,有点硬核。
请根据自己的任务来选择要学习的内容,针对性的学习。
工具
对于代码而言,首先要解决一下IDE的问题。环境方面我们用anaconda环境,IDE我们在VSCode和Pycharm(专业版)中二选一。
两者均未用过的,优先选Pycham,相对更加友好。
Pycharm&&Anaconda
2024Pycharm IDE激活码【亲测有效】_pycharm密钥-CSDN博客(专业版pycharm下载)
超详细的pycharm+anaconda搭建python虚拟环境_pycharm anaconda环境搭建-CSDN博客(pycharm+anconda)
10个的常用PyCharm插件-CSDN博客(常见的插件,想用自己可以下)
VSCode&&Anaconda
Anaconda + VS Code 的安装与使用_anaconda vscode-CSDN博客(vscode+anaconda)
Jupyter notebook
用于学习和实验。Pycharm专业版可以直接用(直接创建.ipynb文件即可),Pycharm社区版用不了(这也就是为什么我们用专业版),VSCode下载一个Jupyter插件就可以用了。
Md扩展
Markdown 是一种轻量级的标记语言,它允许人们使用易读易写的纯文本格式编写文档。Markdown 的目标是实现“易读易写”,总而言之,就是写起来比word快,哈哈哈。
可以使用专业的markdown软件——typora,但是要钱,但是可以pojie,但是其实也没有太大必要,但是你想专业一点也可以。
可以直接使用Pycharm或VSCode,两者用法一样,直接下载markdown的相关插件即可。
下面是一些markdown的基础教程(感兴趣者可以看看):
手把手教会你使用Markdown【从入门到精通一篇就够了】-CSDN博客
Markdown语法教程(超详细)-CSDN博客
Linux环境
有代码任务以及需要与Linux服务器交互者,可以下载这个:
家庭/学校免费 - NetSarang Website
用于和Linux服务器交互,conda相关的指令以及Linux常见的指令也需要掌握。可以私信我拿到连接的私钥文件。
此外,VSCode和Pycharm(专业版才行,这是我们要专业版的第二个理由)可以直接SSH环境,具体可以查相关教程。
论文
Latex
Latex是一个专业的写作软件(markdown追求轻量,Latex追求专业,word追求直观的操作)。
写Latex的工具有很多。
用在线工具,点链接直接跳转:Overleaf, 在线LaTeX编辑器
可以在Pycharm或VSCode中做Latex的扩展,实现过程有点小麻烦,可以上网查。
可以直接用本地的工具,还挺多:实用的 LaTeX 编辑器_latex编辑器-CSDN博客
Latex的体系还挺大的(有一说一,个人感觉,比Python难),这里有一个还不错的文章:【论文写作】LaTeX学习笔记:一文入门LaTeX(超详细)-CSDN博客
当然,Latex远远不止这些,光是公式编辑就有一堆东西了。
插图工具
论文中的插图,一般是用PPT和PS。
我就不班门弄斧了。
有问题多请教师姐。
Python
快乐编程
Python是干生信的基本功,计划在该行业发展的自然要把它学好。
无python基础者可以上B站:
你觉得自己这辈子都学不会编程?超超超基础Python课程,3小时快速入门 【自学Python教程合集】【3小时快速入门Python】_哔哩哔哩_bilibili
有基础者可以看这个,下面这个是一个系列,下面有一堆东西,只是讲得有些简略,看不懂的再搜相关博客或者开源网站补补就OK了。学1-14就差不多了。
Python 基础(一):入门必备知识_python1基础学习-CSDN博客
下面这个挺全,挺适合学习和查漏补缺,虽然要9块9。上面写了100天,其实只是他一天写一篇,写了100多篇而已,而不是真的要学那么久。
100天精通Python_袁袁袁袁满的博客-CSDN博客
数据分析
首先就是数据分析三剑客:numpy pandas matplotlib。
粗鲁来讲,一个算向量和矩阵的,一个做表的,一个画图的。(之所以说“粗鲁”,因为它们三的能力可不止这么简单哈哈哈)
这三个东东总给人一种怎么学都学不完的感觉......学浅也可,学深也可......
三种学习思路,三选一即可
可以用菜鸟教程学:
NumPy 教程 | 菜鸟教程
Pandas 教程 | 菜鸟教程
Matplotlib 教程 | 菜鸟教程
如果花9块9买了之前那个专栏,也可以直接用那个来学。另外,这个专栏还有seaborn bokeh pyecharts等画图教程。
100天精通Python_袁袁袁袁满的博客-CSDN博客
也可以直接上B站,搜“数据分析三剑客”。
快乐爬虫
目的是和各种生信数据库和各种开源网站快乐的打交道。有这些常见的库:
requests:不管三七二十八,先得连上去。
re:不变应万变,粗暴但有用。
bs4:这个最容易上手,十分适合速成,但其实写起来慢。
lxml:主要是为了xpath,这个路径表达式可以直接精准制导,比bs4快多了。
selenium:可以模拟“屏幕前的人类”去点击,另外,觉得它过时了,derisionpage也行。
最好用过scrapy框架,虽然我们的项目大概率不会用,但是毕竟可以提高工程能力。
其他的如pyquery、多进程/线程、异步、写html都没太大必要。
可以在博客或者知乎上挨个挨个学(更快),嫌麻烦可以直接看这个:2023最新最全python爬虫教程【Scrapy框架+js逆向 +分布式爬虫】这还学不会,你来找樵夫!_哔哩哔哩_bilibili
生物信息库
知道常用的功能即可,没必要全都记住(毕竟随时可以查文档,也可以问ai,哈哈哈)
RDkit
最重要的生物信息库,重点要了解几种分子对象、分子指纹、化学性质等。
英文官网:The RDKit Documentation — The RDKit 2024.09.1 documentation
中文教程:RDKit中文教程 — RDKit 中文教程 2020.09 文档
Openbabel
感觉没必要了解太多,在我们已有的项目中这个库主要是用来做一个格式转化的。
英文官网:Open Babel - the chemistry toolbox — Open Babel openbabel-3-1-1 documentation
PyBioMed
这个似乎用的更少,几乎不需要掌握。
官网:The PyBioMed Documentation — PyBioMed 1 documentation
机器学习
首先声明,学机器学习和学机器学习库是两码事。没有代码任务的成员可以学一下前者。
机器学习入门
机器学习入门,还是一如既往的首推吴恩达,只看第一和第二部分。第三部分的无监督学习我们用不着。(超爽中英!) 2024公认最好的【吴恩达机器学习】教程!附课件代码 Machine Learning Specialization_哔哩哔哩_bilibili
机器学习算法
传统机器学习算法无需精通,毕竟我们用的是深度学习算法。
了解常见的机器学习算法,可以看这个五分钟机器学习:五分钟机器学习的个人空间-五分钟机器学习个人主页-哔哩哔哩视频
也可以看我的博客():机器学习&深度学习_入门笔记_千233的博客-CSDN博客
Scikit-learn
听说打过数模的对这个库都挺熟。
Python最重要的机器学习库,网上的教程很多,另外根据学习的深浅学习的思路也不一样,这篇文章还不错:全网最全的Scikit-Learn学习手册!-CSDN博客
也可以在实战中学(更推荐):阿里云天池大赛赛题解析-机器学习篇。这本书有多个案例,跟着做完一个就对scikit-learn就挺熟悉了。
链接:https://pan.baidu.com/s/1ouMWfEmPigQlwamy4t29TA?pwd=aaoe
提取码:aaoe
机器学习百科全书
这个真的是一个百科全书,供查阅各种数学和算法基础,也可以用于帮助整理问答集。
博客目录与概览_个人博客系统查阅资料目录-CSDN博客
深度学习
核心部分。看完之前的吴恩达教程就可以开干了!
三个深度学习库
Pytorch和tensorflow两个至少掌握一个(推荐Pytorch,当然两个都会更好哈哈哈),deepchem必须会。
Pytorch可以先从B站的小土堆开始(虽然他重点讲的是卷积神经网络),教程中的环境搭建有点麻烦(不是教程的错,是因为真的麻烦),可以用实验室的环境:PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】_哔哩哔哩_bilibili
顺便这里也提一下Pytorch的官网:PyTorch
Deepchem用起来很方便,直接看官网即可:DeepChem
深度学习算法
如果想由下向上学好深度学习的话,一般我们都是看沐神(前排提醒,有难度!而且不低!)
视频里面xxx的详细代码实现不用看,直接看简洁版实现即可。代码细节没必要扣,理解意思即可。
看李沐的教程主要是看CNN系列和RNN系列,中间一些CV和NLP领域的知识我们自然不用看。另外,李沐的课程到了Transformer后难度会突然暴涨,对学习者极不友好。所以到Transformer及以后就不看了,看其他的教程。
视频:跟李沐学AI的个人空间-跟李沐学AI个人主页-哔哩哔哩视频
教材:《动手学深度学习》 — 动手学深度学习 2.0.0 documentation
团队的算法
如果认为没太大必要从下往上一步步学深度学习的话,可以直接看这里(虽然有些难度)。
团队项目中使用到的模型框架和深度学习算法在这里:
深度学习_千233的博客-CSDN博客
从Transformer开始写起,里面提到了团队所用到的算法以及学这些算法前需要学会的算法,在持续更新ing......
后话
学代码遇到不会的,一般可以这样做:
CSDN - 专业开发者社区
Kimi.ai - 会推理解析,能深度思考的AI助手
有能力可以多逛逛开源社区:
GitHub · Build and ship software on a single, collaborative platform · GitHub