VM虚拟机安装+ubuntu20.04安装基本配置+hadoop3.2.1安装及配置单机和伪分布模式

it2025-04-02 33

学校最近有一个人工智能大赛，其中有一个大数据竞赛。完全是个小白的我根据林子雨老师的教程和视频，进行hadoop的环境配置和安装，由于对ubuntu的了解很少，只能尽量减少错误，还希望大佬能多多指正！

首先是linux系统的安装，这里我选择ubuntu系统（严格来说，Linux并不是操作系统，而是一个操作系统的内核，Ubuntu基于linux内核的桌面PC操作系统，术语上喜欢称Ubuntu是一个 Linux 发行版。相当于window也有win8，win10）还有centOS和mint也是Linux的发行版，用ubuntu的理由是觉得该发行版的问题解决方案比较多且详细。对于系统的安装，可以选择双系统安装或者在虚拟机上安装；对于电脑配置过低的朋友可以选择双系统，一般都可以选择在虚拟机上安装比较方便

言归正传：对于VM虚拟机安装是根据一个b站大佬的教程来安装的 VM虚拟机安装教程网址（ https://www.bilibili.com/read/cv7620634?from=search） ①下载VMware虚拟机点击该网址 https://www.vmware.com/products/workstation-pro.html 点击Download 我这里选择Windows版本进行下载打开下载好的VM安装向导按图操作即可

安装位置可自行决定，不太建议安装在系统C盘中

点击完成即可接着点击桌面生成的VM软件图标这里需要我们输入许可证密钥输入以下三个中任意一个许可证密钥这三个应该都可以，如果一个不对，可以换一个，我用的是第三个输入完点击继续

点击完成，VMware虚拟机就安装完毕了~

②ubuntu20.04系统镜像下载安装完VM虚拟机之后，就要开始进行ubuntu系统的镜像下载以及将其配置在刚下好的VM虚拟机上。点击网址进入ubuntu官网 https://ubuntu.com/download/desktop 点击Download及可下载可以先选择下载位置，可以在除系统C盘外的任何一个盘新建一个文件夹（好找就行！）下载好的文件如下所示打开我们之前下好的VM虚拟机，选择创建新的虚拟机

接下来按图操作即可这里我们需要点击浏览来找到我们前面下载好的ubuntu20.04镜像文件这里是设置ubuntu系统操作的用户名，和密码密码注意要简洁好记，以后再ubuntu系统下会经常用到！选择一个方便的存放文件也可以通过拆分磁盘，将ubuntu放到一个空磁盘中。这里磁盘容量不小于20G，可以多分配一点这里有一个自定义硬件的选项，一般不用改动，也可以根据自己的需求来改动，后期可以重复改动的，之后点击完成即可！

输入之前设定的密码即可登录！ ③ubuntu20.04界面如下为了方便截图，暂时先不弄成全屏

这里我们先进行一些网络上的设置，设置完之后，在终端的下载会快很多！按图操作搜索栏中输入s 选择箭头所指软件选择other 向上滑动鼠标找到China 选择mirror.aliyun.com 输入密码选择Reload即可完成设置之后点击右上角的倒三角形打开设置

找到语言设置，可以下载中文来获得一个系统的汉化以及中文智能输入法

勾中Chinese（simplifled），并且点击Apply即可等待完成即可完成之后需要点击桌面右上角倒三角来重启一下系统再按之前的方法找到语言设置，点击 + 号选择Chinese 点击Add之后再点击箭头所指位置点击汉语，并且点击Select即可点击重启重启之后，弹出该页面，选择更新名称即可（如果重启之后桌面图标消失，再重启一次即可）

④接下来简洁安装hadoop3.2.1操作，具体操作及原理可参考林子雨老师的教程网址 http://dblab.xmu.edu.cn/blog/install-hadoop/ 点击鼠标右键，选择在终端中打开输入sudo apt-get update 回车，输入密码（注意：ubuntu不显示密码）接着输入sudo apt-get install vim 输入Y，并按下回车继续可以输入clear来清空一下终端显示的内容，方便下一步的操作输入sudo apt-get install openssh-server

输入Y继续显示完后再次输入clear清空一下输入ssh localhost 输入yes继续然后提示输入密码看到下图所示内容说明操作成功为了避免每次登录都要输入密码，我们进行一下简化操作

输入exit先退出登录输入cd ~/.ssh/ 输入ssh-keygen-t rsa 然后按三次回车键出现下图说明操作成功再输入cat ./id_rsa.pub >> ./authorized_keys 这样我们就完成了一个免密登录的操作再次输入ssh localhost来判断一下是否成功可以看到输入ssh localhost之后不需要再次输入密码即可登录接下来配置jdk 在终端输入sudo apt-get install default-jre default-jdk 提示输入Y继续即可完成输入如下命令检测是否成功 cd java -version 出现下图所示说明按照成功

输入cd ~ 输入vim ~/.bashrc 并且按回车即可出现下图若出现这个，再按一次回车即可将光标通过方向键移至此处按下字母O键即可出现下图输入export JAVA_HOME=/usr/lib/jvm/default-java 输入完后按ESE键，然后再输入英文格式的冒号 : 即可发现冒号和光标出现再最下端输入wq，再按回车保存若出现错误，请在wq后面加！，然后再按回车即可再输入source ~/.bashrc 使变量设置生效分别输入 echo $JAVA_HOME java -version 若和下图一样，说明成功配置jdk

接下来安装hadoop 官网下载网址 http://hadoop.apache.org/ 这里我选择通过ubuntu系统自带的火狐浏览器搜索该网址并下载或者在电脑原系统下用浏览器搜索该网址，将hadoop-3.2.1下载到u盘再通过u盘传到虚拟机的ubuntu系统上也可以选择3.2.1版本

点击ok开始下载下载完成后在桌面点击鼠标右键，点击在文件管理器中显示桌面找到下载这一栏，可以发现下载好的hadoop-3.2.1 点击这个可以更改一下输入法改成中文（智能拼音）按ctrl + alt + T 来打开终端分别输入下面几个命令 sudo tar -zxf ~/下载/hadoop-3.2.1.tar.gz -C /usr/local cd /usr/local/ sudo mv ./hadoop-3.2.1/ ./hadoop sudo chown -R hadoop ./hadoop 完成之后，输入如下命令查看hadoop-3.2.1是否安装成功 cd /usr/local/hadoop ./bin/hadoop -version 若出现下图所示，说明安装成功到此我们就完成了hadoop单机模式的配置

接下来设置一下hadoop的伪分布模式桌面点击右键

点击core-site.xml 文件内容如下在19和20行之间插入下列内容

<property> <name>hadoop.tmp.dir</name> <value>file:/usr/local/hadoop/tmp</value> <description>Abase for other temporary directories.</description> </property> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property>

插入后如下图所示点击保存并关闭再点击hdfs-site.xml 同样在

之间，插入下列内容即可

<property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/usr/local/hadoop/tmp/dfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/usr/local/hadoop/tmp/dfs/data</value> </property>

插入后如下图所示点击保存并关闭

再次打开终端输入下图两个命令接着再输入下图两个命令此时便开启了伪分布式模式如何测试是否真正完成输入jps 若与下图相同，则说明部署hadoop-3.2.1伪分布式模式成功！后续还有eclipse的相关下载和hadoop-eclipse-plugin的下载和操作，会继续更新的:)

最新回复(0)