经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
 R语言

画相关性热图

数据格式如下 Sample CM11 CM12 CM13 CM21 CM22 CM23 CM31 CM32 CM33 CM11 1 0.9627369 0.9884578 0.9841946 0.9762492 0.983613 0.9575127 0.743262 0.6178 ...[2019/6/13]

KEGG富集分析散点图.md

输入数据格式 pathway = read.table("kegg.result",header=T,sep="\t") pp = ggplot(pathway,aes(richFactor,Pathway)) #Pathwy是ID,richFact...[2019/6/13]

链家广州二手房的数据与分析——爬取数据

之前在博客分享了利用 R 和 rvest 包爬虫的基础方法。现在就来实战一下:爬取链家网广州 40,000+ 套二手房的数据。 之前在 Web Scraping with R 说过的爬虫方法在这篇中就不在赘述了。这里就分享怎么样爬取网站中翻页的数据。 >> Web Scr...[2019/6/10]

Word Cloud (词云) - R

在前面已经陆续总结了如何用 Python 和 JavaScript 创建词云了,今天要说的是 R。其实 SPSS 和 SAS 的 Word Cloud 扩展模板都是基于 R 实现的。 Create Word Cloud via R 1) 准备文本。 我们再…再次使用上次保存的 Word Cl...[2019/6/6]

Web Scraping with R: How to Fill Missing Value (爬虫:如何处理缺失值)

网络上有大量的信息与数据。我们可以利用爬虫技术来获取这些巨大的数据资源。 这次用 IMDb 网站的2018年100部最欢迎的电影 来练练手,顺便总结一下 R 爬虫的方法。 Preparation 感谢 Hadley Wickham 大大,我们有 rvest 包可以用。因此爬虫前先安装并加载 ...[2019/6/6]

Rust所有权语义模型

  编程语言的内存管理,大概可以分为自动和手动两种。   自动管理就是用 GC(垃圾回收)来自动管理内存,像 Java、Ruby、Golang、Elixir 等语言都依赖于 GC。而 C/C++ 却是依赖于手工管理内存,程序员使用 malloc 和 free 函数来分配释放内存。   GC...[2019/6/4]

数据框筛选特定的子集

a=read.table(file = "H_V75_ENSG,T,P_type-mart_export.txt",header = TRUE,sep = "\t")#以数据框格式读取原文件pro_cod=a[a$Gene.Biotype=="protein_coding",]#筛选出数据框中第四...[2019/6/3]

R数据分析(一)

R语言特点: 主要用于统计分析、图表显示。   属于解释型语言。支持模块化编程。 应用:数据科学、统计计算、机器学习   学习方法: 做笔记,记重点或者心得 手动实践,加深理解 坚持练习,利用身边数据进行应用分析 理解扩展包和函数背后的原理 运行R语...[2019/5/14]

R语言dataframe的常用操作总结

前言:近段时间学习R语言用到最多的数据格式就是data.frame,现对data.frame常用操作进行总结,其中函数大部分来自dplyr包,该包由Hadley Wickham所作,主要用于数据的清洗和整理。 一、创建 data.frame创建较为容易,调用data.frame函数即可。本...[2019/5/10]

解决新版本R3.6.0不能加载devtools包问题

首先是看到下面这个文章想试着练习一下,结果第一步就卡住了,无法加载devtools包,繁体字都冒出来了......汗!(没有截图,但过程痛苦不堪~) https: www.sohu.com/a/122630261_468636   在网上遍寻不着此题的答案,但根据热心网友的回...[2019/5/5]

D02-R语言基础学习

D02-R语言基础学习

R语言基础学习——D02 20190423内容纲要:    1、前言   2、向量操作     (1)常规操作     (2)不定长向量计算     (3)序列     (4)向量的删除与保留   3、列表详解     ...[2019/4/23]

Patchwork(2013年)--CNV检测方法流程

文章题目:Patchwork: allele-specific copy number analysis of whole-genome sequenced tumor ti ue 特点: 可以检测配对样本,也可以检测带reference的tumor样本。但是没有考虑肿瘤异质性问题。使用DNA...[2019/3/15]

R语言入门 :基本数据结构

R语言入门 :基本数据结构

1、向量 向量是R语言中最基本的数据类型,在R语言中没有单独的变量。 (1)  创建向量 R语言中可以用 = 或者 <- 来赋值。 向量名 <- 向量 或  向量名 = 向量 向量的创建方式有c()函数,seq()函数等。 注:R中的向量...[2019/3/15]

R语言读入数据库的中英名词互译测试并计分脚本(考试用)

    1. 分子生物学中英文.csv,输入文件,两列,以tab键分隔的txt文本,没有列名     2. 错误的名解.csv, 如果在测试中拼写错误,会写出到这个文件,可用这个容易犯错的名词进行新的测试   &n...[2019/3/11]

分享一些一分钟快三大小单双走势技巧,如何快三回血上岸,大家一起来交流。

导师359213571如果你是刚刚玩,我来教教你,如果你已经玩很久了,却不稳,我来拉拉你,如果你已经遍体鳞伤,我来帮帮你. 我不能保证你一夜致富但希望能细水长流,汇聚江海,先要平稳的心态,不要一盘的失误影响你心情。 自己有规划性和目标性。做到这两点,过来找我我来帮你。 1、死跟计划。现...[2019/2/27]

相关不是因果,哪又是啥?

相关不是因果,哪又是啥?

目录 相关不是因果,哪又是啥? 导论 一个典型的数据科学课题 常规分析方法 方法一:画出双变量关系 方法二:对所有可用特征使用 ML 模型 ...[2019/2/26]

在 R 中估计 GARCH 参数存在的问题(基于 rugarch 包)

目录 在 R 中估计 GARCH 参数存在的问题(基于 rugarch 包) 导论 rugarch 简介 指定一个 \(\text{GARCH}(1, 1)\) 模型 模拟一个 G...[2019/2/20]

R 语言的Dataframe常用操作

R 语言的Dataframe常用操作

上节我们简单介绍了Dataframe的定义,这节我们具体来看一下Dataframe的操作 首先,数据框的创建函数为 data.frame( ),参考R语言的帮助文档,我们来了解一下data.frame( )的具体用法: Usage data.frame(..., row.names = NU...[2019/2/1]

R语言的数据输入

既然了解了R语言的基本数据类型,那么如何将庞大的数据送入R语言进行处理呢?送入的数据又是如何在R语言中进行存储的呢?处理这些数据的方法又有那些呢?下面我们一起来探讨一下。 首先,数据输入最直接最直观的方法就是键盘输入,在上面几篇都已经讲到,利用c创建向量,利用matrix创建矩阵,利用data....[2019/2/1]

R 脚本读取汇总 Excel 表格数据

主要用到了 xlsx 和 rJava 包,打开 Excel 文件,读取各表格数据,再写入到汇总表。 下图为处理前的原始数据表格: 下图为处理后的数据: 代码实现 安装&加载包的函数实现。installed.packages() 函数获取所有已安装的包,用以排除已安装的包。...[2019/1/28]

Bagging(R语言实现)—包外错误率,多样性测度

1.      Bagging Bagging即套袋法,其算法过程如下: 从原始样本集中抽取训练集。每轮从原始样本集中使用Bootstraping的方法抽取n个训练样本(在训练集中,有些样本可能被多次抽取到,而有些样本可能一次都没有被抽中)...[2019/1/11]

R实战 第十一篇:处理缺失值

在真实的世界中,缺失数据是经常出现的,并可能对分析的结果造成影响。在R中,经常使用VIM(Visualization and Imputation of Mi ing values)包来对缺失值进行可视化和插补。在使用VIM绘图时,有些绘图函数会对缺失值会自动进行插补。 缺失数据的分类: ...[2018/12/28]

Ubuntu 12.04上安装R语言

Ubuntu 12.04上安装R语言 作者:凯鲁嘎吉 - 博客园 http: www.cnblogs.com/kailugaji/ R的安装 sudo gedit /etc/apt ources.list 在sources.list文件后面添加一行 deb http: f...[2018/12/24]

老树新芽——矩估计遇到神经网络

老树新芽——矩估计遇到神经网络

目录 老树新芽——矩估计遇到神经网络 问题 解决方案 \(\text{GARCH}(1,1)\) 模型的神经矩估计设想 代码实现 验证估计结果 \(\omega\) \(\alpha\) \(\beta\) 一个悬而未决的理论问题 \(\text{GARCH}(1,1)\) 模型矩的统计性质...[2018/12/24]

基于R语言的尼罗河流量预测

数据来源: R语言自带 Nile 数据集(尼罗河流量) 分析工具:R-3.5.0 & Rstudio-1.1.453 本篇只是一个简单的分析,不做深究,希望各路大佬指正 #清理环境,加载包 rm(list=ls()) library(forecast) library(tseries)...[2018/12/18]

基于R语言的简单时间序列分析预测

数据来源: R语言自带 co2 数据集 分析工具:R-3.5.0 & Rstudio-1.1.453 本篇分析只是一个简单的教程,不作深究 #清理环境,加载包 rm(list=ls()) library(forecast) library(tseries) #查看数据 co2 View...[2018/12/17]

在 R 中估计 GARCH 参数存在的问题(续)

在 R 中估计 GARCH 参数存在的问题(续)

目录 在 R 中估计 GARCH 参数存在的问题(续) rugarch 包的使用 简单实验 rugarch 参数估计的行为 极端大样本 结论 在 R 中估计 GARCH 参数存在的问题(续) 本文承接《在 R 中估计 GARCH 参数存在的问题》 链接:https: www.cnbl...[2018/12/10]

在 R 中估计 GARCH 参数存在的问题

目录 在 R 中估计 GARCH 参数存在的问题 GARCH 模型基础 估计 GARCH 参数 fGarch 参数估计的行为 结论 译后记 在 R 中估计 GARCH 参数存在的问题 本文翻译自《Problems In Estimating GARCH Parameters in R 》...[2018/11/22]

R链接hive/oracle/mysql

Linux:R连接hive用的Rhive 1,重要 1,sudo R CMD javareconf 2,sudo R 3, 1+1 是否为2 3.1,>install.packages("rJava") >install.packages("Rse...[2018/11/9]

如何将R中的data frame对象的数据导入到DB

在使用ARIMA模型来预测我们的销量的时候,如果保存预测版本进DB,以供后续分析呢 1. 在定义变量阶段我们定义了dfResult      <- data.frame()   这是一个data frame 2. 预测的结果通常是一个vector   例...[2018/11/8]

《R语言实战(第2版)》高清中文版PDF+高清英文版PDF+源代码

下载:https: pan.baidu.com 1DMDKWi9RPs4pYNbK1Kvc_A 《R语言实战(第2版)》高清中文版PDF+高清英文版PDF+源代码 高清中文版558页,高清英文版628 页。 中文和英文两版对比学习, 带目录书签,可复制粘贴; 配套源代码; 经典书籍,讲解...[2018/10/24]

使用记忆化优化你的 R 代码

目录 使用记忆化优化你的 R 代码 R 中的性能优化 R 何时变慢 R 何时变(更)快 R 中的记忆化 何时使用记忆化 使用记忆化优化你的 R 代码 本文翻译自《Optimize your R Code using Memoization》(有删减) https: www.inwt-s...[2018/10/21]

R语言初级教程(04): 算术运算

通过前面三篇博客的学习,我们应该知道如何搭建R编程环境了,也掌握了RStudio的使用,同时也了解了R的功能用途。 好了,现在正式开始R之旅。 R的一个最简单功能,是它可以充当计算器来用,而且是个超级计算器。 R中的基本运算包括:算术运算、关系运算、逻辑运算、赋值运算以及其他运算。 这...[2018/10/9]

血压数据的可视化和分析(1)

血压数据的可视化和分析(1)

根据世界卫生组织规定,成人收缩压≥140mmHg或(和)舒张压≥90mmHg时即可确诊为高血压。收缩压≤120mmHg称为理想血压,收缩压≤130mmHg称为正常血压,介于130和140之间者,称为临界高血压。 现有一份血压数据,样本记录500条数据,包括三个值:血压、是否抽烟、体重过重级别。 ...[2018/9/25]

时间序列深度学习:状态 LSTM 模型预测太阳黑子

目录 时间序列深度学习:状态 LSTM 模型预测太阳黑子 教程概览 商业应用 长短期记忆(LSTM)模型 太阳黑子数据集 构建 LSTM 模型预测太阳黑子 1 若干相关包 2 数据 3 探索性数据分析 4 回测:时间序列交叉验证 5 用 Keras 构建状态 LSTM 模型 结论 时间序列...[2018/9/25]

《R数据挖掘入门》彩色插图(第9章)

    图9.5              图9.9  [2018/9/25]

data.table包使用应该注意的一些细节

fread中nThread 参数的使用 ??注意默认nThread=getDTthreads(),即使用所有能用的核心,但并不是核心用的越多越好,本人亲自测试的情况下,其实单核具有较强的性能,只有在数据大于3Gb的情况下,开启11核(我的机器全部核心30多核)效率才比一个核心更高,而默认使用全部的...[2018/9/25]

时间序列分析工具箱——tidyquant

目录 时间序列分析工具箱——tidyquant tidyquant 的用途 加载包 tq_get:获得数据 从 Yahoo! Finance 获得股票数据 从 FRED 获得经济数据 使用 tq_transmute 和 tq_mutate 转换数据 tq_transmute tq_mutate...[2018/9/25]

ggplot2 aes函数map到data笔记

.all_aesthetics <- c("adj", "alpha", "angle", "bg", "cex", "col", "color", "colour", "fg", "fill", "group", "hjust", "label", "linetype", "lower"...[2018/9/25]

[转载]机器学习预测世界杯:巴西夺冠 - FA-learning

来源:Medium,Github,KDnuggets等 作者:李静怡,克雷格 【新智元导读】2018年世界杯开幕在即,谁会赢得最后的冠军?机器学习预测是巴西,而统计方法则认为德国会赢。 3天后,2018年俄罗斯世界杯开打,首场比赛是东道主俄罗斯对阵沙特阿拉伯,将于6月14日拉开序幕。 ...[2018/9/25]

R语言S3类的理解与构建

R语言类 R语言的类有S3类和S4类,S3类用的比较广,创建简单粗糙但是灵活,而S4类比较精细,具有跟C++一样严格的结构。这里我们主要讲S3类。 S3类的结构 S3类内部是一个list,append某个list类名称,就能成为该类。list里面的内容就是我们所说的属性. 首先创建一个list...[2018/9/25]

时间序列分析工具箱——timetk

目录 时间序列分析工具箱——timetk timetk 的主要用途 加载包 数据 timetk 教程: PART 1:时间序列机器学习 PART 2:转换 翻译自《Demo Week: Time Series Machine Learning with timetk》 原文链接:ww...[2018/9/25]

通过R语言统计考研英语(二)单词出现频率

通过R语言统计考研英语(二)单词出现频率 大家对英语考试并不陌生,首先是背单词,就是所谓的高频词汇。厚厚的一本单词,真的看的头大。最近结合自己刚学的R语言,为年底的考研做准备,想统计一下最近考研英语(二)真正单词出现的频率次数。 整体思路: 收集数据-->整理数据-->统计分析--&...[2018/9/25]

时间序列分析工具箱——sweep

目录 时间序列分析工具箱——sweep sweep 的用途 加载包 数据 Demo:forecast + sweep 的简化预测工作流 STEP 1:创建 ts 对象 STEP 2A:ARIMA 模型 STEP 2B:简化模型 STEP 3:预测 STEP 4:用 sweep 简化预测 STEP...[2018/9/25]

快速链接bioconductor,以及安装“XML”

快速链接bioconductor,以及安装“XML”

1 options(useHTTPS=FALSE, BioC_mirror="http: bioconductor.org") 2 3 4 source("http: bioconductor.org/biocLite.R")   install.packages("XML...[2018/9/25]

时间序列深度学习:seq2seq 模型预测太阳黑子

目录 时间序列深度学习:seq2seq 模型预测太阳黑子 学习路线 商业中的时间序列深度学习 商业中应用时间序列深度学习 深度学习时间序列预测:使用 keras 预测太阳黑子 递归神经网络 设置、预处理与探索 所用的包 数据 探索性数据分析 回测:时间序列交叉验证 LSTM 模型 数据准备 ...[2018/9/25]

R包安装的正确方式

1 options("repos" = c(CRAN="https: mirrors.tuna.tsinghua.edu.cn/CRAN/")) 2 if(! require("devtools")) install.packages("devtools") 3 if(! require(...[2018/9/25]

Installation failed: Timeout was reached: Operation timed out after 10000 milliseconds with 0 out of 0 bytes received

Installation failed: Timeout was reached: Operation timed out after 10000 milliseconds with 0 out of 0 bytes received

1 Trying this option worked for me. 2 3 library(httr) 4 with_config(use_proxy(...), install_github(...)) 5 6 OR 7 8 library(httr) 9 set_...[2018/9/25]

R中的空间数据分析

> library(sp) > library(maptools) > library(raster) > library(rgeos) > maxd3 = readAsciiGrid("max.d3.txt")    # 加...[2018/9/25]

R语言grid包just参数如何just图形位置

思路 ??grid的画图函数都含有just,但是just参数的是怎么调节图形位置的总是让人非常费解,于是便写了代码来一探究竟。 ??思路非常简单:放一个2*2的布局viewport,每个布局里面放一个viewport,每个viewport都用了不同的just参数。just之后的矩形用蓝色显示,中...[2018/9/25]

486
2
记录数:52 页数:1/212下一页尾页
加载更多