如何用ruby来写hadoop的mapreduce并生成jar包 - 日子头上一把刀--DRY&&KISS - ITeye博客

`

wudixiaotie

浏览: 132868 次
性别:
来自: 北京

最近访客更多访客>>

westsum

lzzzlzz

zhg170

孔已己

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

wudixiaotie： white_crucifix 写道吓死宝宝了，以为有erlan ...
erlang hibernate
white_crucifix：吓死宝宝了，以为有erlang版的hibernate框架
erlang hibernate
zzjmates： ...
rails缓存清空
wudixiaotie：没用过rubymine
rails调试
string2020：和工具(rubymine)提供的调试方式比,那个好
rails调试

如何用ruby来写hadoop的mapreduce并生成jar包

博客分类：

ruby

阅读更多

ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢：

1.安装rvm：

不说了网上有

2.安装ruby：

由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。

3.安装jruby：

rvm install jruby然后等待安装完成

4.给编写mapreduce的目录设置默认的ruby版本和gemset：

进入到目标目录，执行rvm --create --ruby-version jruby-1.7.19@hadoop

生成两个文件.ruby-version和.ruby-gemset，一个是定义当前目录的默认ruby版本，一个是定义默认的gemset。

有了这两个文件已进入这个目录rvm自动帮你切换到jruby@hadoop，这样才能运行rubydoop。

5.编写代码：

需要说明的是目录结构必须是

├── Gemfile

├── lib

│ ├── word_count_job.rb

│ └── word_count.rb

└── Rakefile

如果没有需要安装的gem，则touch个空的Gemfile就好，所有的代码都放在lib目录下。

6.生成jar包：

rake package

7.用hadoop运行生成的jar包：

hadoop jar build/word_count.jar word_count_job path/to/input path/to/output

3
顶

1
踩

分享到：

hadoop学习笔记 | rust的指针作为函数参数是直接传递，还是先 ...

2015-07-17 19:09
浏览 606
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop mapreduce实现wordcount: Hadoop 用mapreduce实现Wordcount实例，绝对能用

hadoop最新版本3.1.1全量jar包: hadoop-annotations-3.1.1.jar hadoop-common-3.1.1.jar hadoop-mapreduce-client-core-3.1.1.jar hadoop-yarn-api-3.1.1.jar hadoop-auth-3.1.1.jar hadoop-hdfs-3.1.1.jar hadoop-mapreduce-client-hs-3.1.1.jar ...

hadoop-mapreduce-examples-2.7.1.jar: hadoop-mapreduce-examples-2.7.1.jar

hadoop的外部依赖jar包: 有时候在eclipse上运行项目，需要引用的Hadoop的jar包，也就是hadoop的外部依赖包，有conf，fs，io，mapreduce等等，这里列举了一部分，基本上hadoop的所有外部依赖jar包都包含在内了，如果下载了不会使用，可以看我...

Hadoop MapReduce实现tfidf源码: 用MapReduce实现TF-IDF，Hadoop版本是2.7.7，参考某教程亲自手写的，可以运行，有问题可以留言

Hadoop MapReduce Cookbook - 2nd Edition: upon the widely used and highly successful Hadoop MapReduce v1. The recipes that will help you analyze large and complex datasets with next generation Hadoop MapReduce will provide you with the skills...

hadoop eclipse mapreduce 下开发所有需要用到的 JAR 包: hadoop eclipse mapreduce 下开发所有需要用到的 JAR 包。 hadoop eclipse 下进行mapreduce开发所有需要用到的JAR包 mapreduce

Hadoop MapReduce Cookbook 高清完整版PDF下载: Hadoop MapReduce Cookbook 高清完整版PDF下载 Hadoop MapReduce Cookbook

Hadoop MapReduce实战手册(完整版): 本书对Hadoop Mapreduce进行详细讲解，切合实际应用，能够更深入地学习MapReduce，确实是一本不错的书。

hadoop-mapreduce-client-jobclient-2.6.5-API文档-中文版.zip: 赠送jar包：hadoop-mapreduce-client-jobclient-2.6.5.jar；赠送原API文档：hadoop-mapreduce-client-jobclient-2.6.5-javadoc.jar；赠送源代码：hadoop-mapreduce-client-jobclient-2.6.5-sources.jar；赠送...

hadoop_common.jar包: hadoop操作的文档文献和hadoopjar包

大数据 hadoop mapreduce 词频统计: 在hadoop平台上，用mapreduce编程实现大数据的词频统计

hadoop-mapreduce-examples-2.6.5.jar: hadoop-mapreduce-examples-2.6.5.jar 官方案例源码

hadoop jar包.rar: 完整的Hadoop jar包，解压直接用。

Hadoop原理与技术MapReduce实验: 一、实验目的（1）熟悉Hadoop开发包（2）编写MepReduce程序（3）调试和运行MepReduce程序（4）完成上课老师演示的内容二、实验环境 Windows 10 VMware Workstation Pro...（1）：写pagerank代码并把代码生成jar包

hadoop1.1.2操作例子包括hbase hive mapreduce相应的jar包: hadoop1.1.2操作例子包括hbase hive mapreduce相应的jar包

Java操作Hadoop Mapreduce基本实践源码: Java操作Hadoop Mapreduce基本实践源码.

Hadoop MapReduce.md: 本章介绍了 Hadoop MapReduce，同时发现它有以下缺点： 1、程序设计模式不容易使用，而且 Hadoop 的 Map Reduce API 太过低级，很难提高开发者的效率。 2、有运行效率问题，MapReduce 需要将中间产生的数据保存到...

Hadoop MapReduce v2 Cookbook （第二版）: Hadoop MapReduce v2 Cookbook （第二版）， Packt Publishing

hadoop的各种jar包: 使用ecplice操作hadoop所需要的各种jar包。包括hdfs,maprudce,yarn,httpfs,kms。

Global site tag (gtag.js) - Google Analytics