转录组分析概述 概述 转录组(transcriptome)广义上指某一生理条件下,细胞内所有转录产物的集合,包括信使RNA、核糖体RNA、转运RNA及非编码RNA;狭义上指所有mRNA的集合。转录组测序分析可以分为有参转录组分析和无参转录组分析。有参无参的意思是,有/无参考基因组。 转录组上游分析 转录组上游分析一般有3种模式: 有参转录组上游分析 有参考基因组无注释文件上游分析或寻找新的转录本 无参考基因 2024-07-26 转录组分析 #生物信息
基因组结构注释 基因组注释分为结构注释和功能注释。 结构注释能够帮助我们获取基因组上详细的基因分布和结构信息,是功能注释和进化分析的重要基础。基因结构预测包括预测基因组中的基因位点、开放性阅读框架(ORF)、翻译起始位点和终止位点、内含子和外显子区域、启动子、可变剪切位点以及蛋白质编码序列等等。 功能注释可以帮助我们进一步获得基因的功能信息,包括预测基因中的模序和结构域、蛋白质的功能和所在的生物学通路等 基因结构 2024-07-26 转录组分析 #生物信息 #生信软件使用 #结构注释 #基因组注释
正则表达式 什么是正则表达式 正则表达式是一组由字母和符号组成的特殊文本,是一种用于匹配和操作文本的强大工具,它可以在文本中查找、替换、提取你想要的文字,也可以用来验证特定的字符组成模式。一个正则表达式一般从左到右匹配主体字符串,常使用缩写的术语“regex”或“regexp”。 工具和基本语法 正则表达式一般以\<regex>\<flag>的形式存在,不同软件可能存在差异。< 2024-07-26 学习 #正则表达式 #python #re模块
使用LaTeX进行数学公式输入 什么是LaTex LaTeX是一个专业的排版系统,擅长处理篇幅较长、结构严谨的文档,并且十分擅长公式表达。它是免费软件,可以在大多数操作系统中安装使用。区别于微软的 Office Word,使用LaTeX并不能「所见即所得」。LaTeX文档是一个以.tex结尾的文本文件,可以使用任何文本编辑器编辑,但对于大多数人而言,使用一个合适的 LaTeX 编辑器会使得编辑的过程容易很多。在编辑的过程中你可 2024-07-24 学习 #LaTeX #数学公式
差异表达分析 差异分析三巨头 DESeq2、edgeR、limma DESeq2、edgeR、limma是转录组差异分析的金标准,大多数转录组的文章和公司都是使用这三个R包做转录组的差异基因分析。 做差异基因表达分析需要的数据有:表达矩阵、分组信息 表达矩阵:即上游分析得到的每个基因在每个样本中的reads数,这里所使用的差异分析包都要求原始reads数的格式输入。 分组信息:即一个实验设计矩阵,包含每一个 2024-06-01 转录组分析 #生物信息 #生信软件使用 #R语言
fastp软件的使用 fastp: A tool designed to provide fast all-in-one preprocessing for FastQ files. This tool is developed in C++ with multithreading supported to afford high performance. fastp,它可以仅仅扫描FASTQ文件一次,就完成比FA 2024-05-29 转录组分析 #生物信息 #生信软件使用