https://www.scala-lang.org/ 官网
Linux 第一个Scala的案例:wordcount
代码如下:
通过这段代码我们需要了解:
1)Scala语言的简洁性
2)函数式编程
3)spark是比MapReduce要快的。
Scala:object-oriented meets functional 面向对象遇到函数式编程
特点:优雅、速度快、能融合到Hadoop生态圈
第一步:在Windows系统下配置Scala环境
下载Scala:现在市场上流行的是2.11版本,所以下载2.11版本
本地版本:.msi,安装之后在命令端直接可以使用了,不需要配置环境变量
然后就可以在Windows下运行Scala代码了:
写一个.scala文件:
object Hello extends App{
def square(args:Array[String]) {
println("Hello, World!")
}
}
在cmd命令窗口进入该文件所在目录,编译:Scalac Hello.scala,运行:Scala Hello.class
第二步:安装IDEA工具
注意选择磁盘上已经有的scala插件
注意要选择sdk目录
注意最后要重启
第三步:编写代码并运行
第一种:直接在IDEA窗口端执行代码
第二种:手动打jar包->在Windows的命令窗口:首先进入该jar包所在目录,然后执行命令:java -jar 1705scala.jar
小提示:在hdfs上也可以使用java -jar运行。
第四步:在Windows的Scala环境下声明变量
使用Windows下的Scala环境来定义变量:
定义变量的修饰符val 和var
两者的区别:var修饰的变量可以修改值;val修饰的变量是final类型的,不可以改变变量的值。
在Scala中鼓励使用val,即不让改变变量的值。
可以这样思考:var是variable--变量,val是value--定义值
基本数据类型:
首先有7中基本数据类型:Byte,Short,char,Int,Long,Float,Double,Boolean
学习Scala常用类型的网站:Scala菜鸟驿站
条件表达式:在Scala中条件表达式是有返回值的,默认返回res0
如果条件表达式的返回值类型不一样,会返回Any类型的变量
如果不写else默认会在后面补一个[else()]最终推断出来的类型是AnyVal
()表示Unit类型,相当于java中的void类型。
块表达式:最后一个表达式的值就是整个块表达式的返回值。要理解这个概念,首先要理解一个块的起始和结束标志,就是一对花括号包含的所有代码就是一个块表达式。
直接在窗口中写批量代码,使用下面这种方式:
scala> :paste
// Entering paste mode (ctrl-D to finish)
写完代码之后按Ctrl+D退出这种模式。
循环:while循环和for循环
while循环:与java中while循环基本无异,但不支持++和--,注意如果要+和-变量要用var修饰
for循环:定义数组 val x=Array(“a”,“b”,"c"),遍历数组
第一种方式 for(i <- x){println(x)}
第二种方式:for(i <- 1 to 10) {println(x)}
第三种方式:for(i <- 1 to x.length-1) {println(x(i))}
第三种方式:for(j <- 0 until x.length){println(x(i))}
小提示:在Scala中运算符==方法
用一个集合(默认是Vector类型) 接收for循环所有的返回值,关键字:yield
位操作符:& | ^ >> <<
调用方法和函数:
方法的声明:方法与执行块之间有=表示有返回值,不写表示没有返回值
两个同名的方法会覆盖
方法的调用:方法名 (实参),如果有返回值用一个变量接收返回值
这整个过程类似于java中的装饰模式以及函数式编程。
装饰模式是指在原有类的基础上,对其中的某些方法进行增强的一种模式,这种模式在java IO中体现的最为明显,字节流到缓存流的封装。
实践:对List集合增强map方法,并且该方法可以实现函数式编程。