大数据技术之Scala

一、面向对象

1、抽象类

1.1抽象属性和抽象方法

1)基本语法

①定义抽象类：abstract class Person{} //通过 abstract 关键字标记抽象类

②定义抽象属性：val|var name:String //一个属性没有初始化，就是抽象属性

③定义抽象方法：def hello():String //只声明而没有实现的方法，就是抽象方法

案例实操

abstract class Person {

val name: String def hello(): Unit

}

val name: String = "teacher" def hello(): Unit = {

println("hello teacher")

}

2)继承&重写

①如果父类为抽象类，那么子类需要将抽象的属性和方法实现，否则子类也需声明为抽象类

②重写非抽象方法需要用 override 修饰，重写抽象方法则可以不加 override。

③子类中调用父类的方法使用 super 关键字

④子类对抽象属性进行实现，父类抽象属性可以用 var 修饰；

子类对非抽象属性重写，父类非抽象属性只支持 val 类型，而不支持 var。

因为var修饰的为可变变量，子类继承之后就可以直接使用，没有必要重写

1.2、匿名子类

1)说明：

和 Java 一样，可以通过包含带有定义或重写的代码块的方式创建一个匿名的子类。

2)案例实操

abstract class Person {

val name: String def hello(): Unit

}

object Test {

def main(args: Array[String]): Unit = { val person = new Person {

override val name: String = "teacher"

override def hello(): Unit = println("hello teacher")

}

2、单例对象（伴生对象）

Scala语言是完全面向对象的语言，所以并没有静态的操作（即在Scala中没有静态的概念）。但是为了能够和Java语言交互（因为Java中有静态概念），就产生了一种特殊的对象来模拟类对象，该对象为单例对象。若单例对象名与类名一致，则称该单例对象这个类的伴生对象，这个类的所有“静态”内容都可以放置在它的伴生对象中声明。

2.1、单例对象语法

1)基本语法

object Person{

val country:String="China"

}

2)说明

①单例对象采用object 关键字声明

②单例对象对应的类称之为伴生类，伴生对象的名称应该和伴生类名一致。

③单例对象中的属性和方法都可以通过伴生对象名（类名）直接调用访问。

3)案例实操

//（1）伴生对象采用 object 关键字声明

object Person {

var country: String = "China"

}

//（2）伴生对象对应的类称之为伴生类，伴生对象的名称应该和伴生类名一致。class Person {

var name: String = "bobo"

}

object Test {

def main(args: Array[String]): Unit = {

//（3）伴生对象中的属性和方法都可以通过伴生对象名（类名）直接调用访

问。

println(Person.country)

}

2.2、apply方法

1)说明

①通过伴生对象的 apply 方法，实现不使用 new 方法创建对象。

②如果想让主构造器变成私有的，可以在()之前加上 private。

③apply 方法可以重载。

④Scala 中 obj(arg)的语句实际是在调用该对象的 apply 方法，即 obj.apply(arg)。用以统一面向对象编程和函数式编程的风格。

⑤当使用 new 关键字构建对象时，调用的其实是类的构造方法，当直接使用类名构建对象时，调用的其实时伴生对象的 apply 方法。

2)案例实操

object Test {

def main(args: Array[String]): Unit = {

//（1）通过伴生对象的 apply 方法，实现不使用 new 关键字创建对象。

val p1 = Person() println("p1.name=" + p1.name)

val p2 = Person("bobo") println("p2.name=" + p2.name)

}

//（2）如果想让主构造器变成私有的，可以在()之前加上 private class Person private(cName: String) {

var name: String = cName

}

object Person {

def apply(): Person = { println("apply 空参被调用") new Person("xx")

}

def apply(name: String): Person = { println("apply 有参被调用")

new Person(name)

}

//注意：也可以创建其他类型对象，并不一定是伴生对象

}

3、特质（Trait）

Scala 语言中，采用特质 trait（特征）来代替接口的概念，也就是说，多个类具有相同的特质（特征）时，就可以将这个特质（特征）独立出来，采用关键字 trait 声明。

Scala 中的 trait 中即可以有抽象属性和方法，也可以有具体的属性和方法，一个类可以混入（mixin）多个特质。这种感觉类似于 Java 中的抽象类。

Scala 引入 trait 特征，第一可以替代 Java 的接口，第二个也是对单继承机制的一种补充。

3.1、特质声明

1）基本语法

trait 特质名 { trait 主体

}

2）案例实操

trait PersonTrait {

// 声明属性

var name:String = _

// 声明方法

def eat():Unit={

}

// 抽象属性

var age:Int

// 抽象方法

def say():Unit

}

3.2、特质基本语法

一个类具有某种特质（特征），就意味着这个类满足了这个特质（特征）的所有要素，所以在使用时，也采用了extends 关键字，如果有多个特质或存在父类，那么需要采用with 关键字连接。

1）基本语法：

没有父类：class 类名 extends 特质 1 with 特质 2 with 特质 3 …

有父类：class 类名 extends 父类 with 特质 1 with 特质 2 with 特质 3…

2）说明

①类和特质的关系：使用继承的关系。

②当一个类去继承特质时，第一个连接词是 extends，后面是with。

③如果一个类在同时继承特质和父类时，应当把父类写在 extends 后。

3)案例实操

（1）特质可以同时拥有抽象方法和具体方法

（2）一个类可以混入（mixin）多个特质

（3）所有的 Java 接口都可以当做Scala 特质使用

（4）动态混入：可灵活的扩展类的功能

（4.1）动态混入：创建对象时混入trait，而无修饰类混入该trait

（4.2）如果混入的 trait 中有未实现的方法，则需要实现

trait PersonTrait {

//（1）特质可以同时拥有抽象方法和具体方法

// 声明属性

var name: String = _

// 抽象属性

var age: Int

// 声明方法

def eat(): Unit = { println("eat")

}

// 抽象方法

def say(): Unit

}

trait SexTrait { var sex: String

}

//（2）一个类可以实现/继承多个特质

//（3）所有的 Java 接口都可以当做 Scala 特质使用

class Teacher extends PersonTrait with java.io.Serializable {

override def say(): Unit = { println("say")

}

override var age: Int = _

}

object TestTrait {

def main(args: Array[String]): Unit = { val teacher = new Teacher() teacher.say()

teacher.eat()

//（4）动态混入：可灵活的扩展类的功能

val t2 = new Teacher with SexTrait { override var sex: String = "男"

}

//调用混入 trait 的属性

println(t2.sex)

}

3.3特质叠加

由于一个类可以混入（mixin）多个 trait，且 trait 中可以有具体的属性和方法，若混入的特质中具有相同的方法（方法名，参数列表，返回值均相同），必然会出现继承冲突问题。冲突分为以下两种：

第一种，一个类（Sub）混入的两个 trait（TraitA，TraitB）中具有相同的具体方法，且两个 trait 之间没有任何关系，解决这类冲突问题，直接在类（Sub）中重写冲突方法。

第二种，一个类（Sub）混入的两个 trait（TraitA，TraitB）中具有相同的具体方法，且两个 trait 继承自相同的 trait（TraitC），及所谓的“钻石问题”，解决这类冲突问题，Scala 采用了特质叠加的策略。

所谓的特质叠加，就是将混入的多个 trait 中的冲突方法叠加起来，案例如下，

trait Ball {

def describe(): String = { "ball"

}

trait Color extends Ball {

override def describe(): String = { "blue-" + super.describe()

}

trait Category extends Ball { override def describe(): String = {

"foot-" + super.describe()

}

class MyBall extends Category with Color { override def describe(): String = {

"my ball is a " + super.describe()

}

object TestTrait {

def main(args: Array[String]): Unit = { println(new MyBall().describe())

}

运行结果：

3.4、特质叠加执行顺序

思考：上述案例中的 super.describe()调用的是父 trait 中的方法吗？

当一个类混入多个特质的时候，scala 会对所有的特质及其父特质按照一定的顺序进行排序，而此案例中的 super.describe()调用的实际上是排好序后的下一个特质中的 describe() 方法。，排序规则如下：

结论：

①案例中的 super，不是表示其父特质对象，而是表示上述叠加顺序中的下一个特质，即，MyClass 中的 super 指代 Color，Color 中的 super 指代Category，Category 中的super指代Ball。

②如果想要调用某个指定的混入特质中的方法，可以增加约束： super[]，例如

super[Category].describe()。

3.5、特质自身类型

1)说明

自身类型可实现依赖注入的功能。

2)案例实操

class User(val name: String, val age: Int)

trait Dao {

def insert(user: User) = {

println("insert into database :" + user.name)

}

trait APP {

_: Dao =>

def login(user: User): Unit = { println("login :" + user.name) insert(user)

}

object MyApp extends APP with Dao {

def main(args: Array[String]): Unit = { login(new User("bobo", 11))

}

3.6、特质和抽象类的区别

①优先使用特质。一个类扩展多个特质是很方便的，但却只能扩展一个抽象类。

②如果你需要构造函数参数，使用抽象类。因为抽象类可以定义带参数的构造函数，而特质不行（有无参构造）。

4、扩展

4.1、类型检查和转换

1)说明

①obj.isInstanceOf[T]：判断 obj 是不是T 类型。

②obj.asInstanceOf[T]：将 obj 强转成 T 类型。

③classOf 获取对象的类名。

2)案例实操

class Person{

}

object Person {

def main(args: Array[String]): Unit = { val person = new Person

//（1）判断对象是否为某个类型的实例

val bool: Boolean = person.isInstanceOf[Person]

if ( bool ) {

//（2）将对象转换为某个类型的实例

val p1: Person = person.asInstanceOf[Person] println(p1)

}

//（3）获取类的信息

val pClass: Class[Person] = classOf[Person] println(pClass)

}

4.2、枚举类和应用类

1）说明

枚举类：需要继承 Enumeration

应用类：需要继承App

2）案例实操

object Test {

def main(args: Array[String]): Unit = {

println(Color.RED)

}

// 枚举类

object Color extends Enumeration { val RED = Value(1, "red")

val YELLOW = Value(2, "yellow") val BLUE = Value(3, "blue")

}

// 应用类

object Test20 extends App { println("xxxxxxxxxxx");

}

4.3、Type定义新类型

1）说明

使用 type 关键字可以定义新的数据数据类型名称，本质上就是类型的一个别名

2）案例实操

object Test {

def main(args: Array[String]): Unit = { type S=String

var v:S="abc"

def test():S="xyz"

}

二、集合

1、集合简介

①Scala 的集合有三大类：序列 Seq、集Set、映射 Map，所有的集合都扩展自 Iterable特质。

②对于几乎所有的集合类，Scala 都同时提供了可变和不可变的版本，分别位于以下两个包

③不可变集合：scala.collection.immutable 可变集合： scala.collection.mutable

scala 不可变集合，就是指该集合对象不可修改，每次修改就会返回一个新对象，而不会对原对象进行修改。类似于 java 中的 String 对象

④可变集合，就是这个集合可以直接对原对象进行修改，而不会返回新的对象。类似于 java 中 StringBuilder 对象

建议：在操作集合的时候，不可变用符号，可变方法

1.1、不可变集合继承图

1)Set、Map 是 Java 中也有的集合

2)Seq 是 Java 没有的，我们发现 List 归属到Seq 了，因此这里的 List 就和 Java 不是同一个概念了

3)我们前面的for 循环有一个 1 to 3，就是 IndexedSeq 下的 Range 4）String 也是属于 IndexedSeq

4)我们发现经典的数据结构比如 Queue 和 Stack 被归属到 LinearSeq(线性序列)

5)大家注意Scala 中的 Map 体系有一个 SortedMap，说明 Scala 的 Map 可以支持排序

6)IndexedSeq 和LinearSeq 的区别：

①IndexedSeq 是通过索引来查找和定位，因此速度快，比如String 就是一个索引集合，通过索引即可定位

②LinearSeq 是线型的，即有头尾的概念，这种数据结构一般是通过遍历来查找

1.2、可变集合继承图

2、数组

2.1、不可变数组

1)第一种方式定义数组

定义：val arr1 = new Array[Int](10)

①new 是关键字

②[Int]是指定可以存放的数据类型，如果希望存放任意数据类型，则指定Any

③(10)，表示数组的大小，确定后就不可以变化

2)案例实操

object TestArray{

def main(args: Array[String]): Unit = {

//（1）数组定义

val arr01 = new Array[Int](4)

println(arr01.length) // 4

//（2）数组赋值

//（2.1）修改某个元素的值arr01(3) = 10

//（2.2）采用方法的形式给数组赋值arr01.update(0,1)

//（3）遍历数组

//（3.1）查看数组println(arr01.mkString(","))

//（3.2）普通遍历 for (i <- arr01) {

println(i)

}

//（3.3）简化遍历

def printx(elem:Int): Unit = { println(elem)

}

arr01.foreach(printx)

// arr01.foreach((x)=>{println(x)})

// arr01.foreach(println(_)) arr01.foreach(println)

//（4）增加元素（由于创建的是不可变数组，增加元素，其实是产生新的数

组）

println(arr01)

val ints: Array[Int] = arr01 :+ 5 println(ints)

}

3)第二种方式定义数组

val arr1 = Array(1, 2)

在定义数组时，直接赋初始值

使用apply 方法创建数组对象

4)案例实操

object TestArray{

def main(args: Array[String]): Unit = {

var arr02 = Array(1, 3, "bobo") println(arr02.length)

for (i <- arr02) {

println(i)

}

2.2、可变数组

1）定义变长数组

val arr01 = ArrayBuffer[Any](3, 2, 5)

①[Any]存放任意数据类型

②(3, 2, 5)初始化好的三个元素

③ArrayBuffer 需要引入scala.collection.mutable.ArrayBuffer 2）案例实操

①ArrayBuffer 是有序的集合

②增加元素使用的是 append 方法()，支持可变参数

import scala.collection.mutable.ArrayBuffer object TestArrayBuffer {

def main(args: Array[String]): Unit = {

//（1）创建并初始赋值可变数组

val arr01 = ArrayBuffer[Any](1, 2, 3)

//（2）遍历数组

for (i <- arr01) { println(i)

}

println(arr01.length) // 3 println("arr01.hash=" + arr01.hashCode())

//（3）增加元素

//（3.1）追加数据arr01.+=(4)

//（3.2）向数组最后追加数据arr01.append(5,6)

//（3.3）向指定的位置插入数据arr01.insert(0,7,8) println("arr01.hash=" + arr01.hashCode())

//（4）修改元素

arr01(1) = 9 //修改第 2 个元素的值

println(" ")

for (i <- arr01) { println(i)

}

println(arr01.length) // 5

}

2.3、不可变数组和可变数组的转换

1）说明

arr1.toBuffer //不可变数组转可变数组arr2.toArray //可变数组转不可变数组

①arr2.toArray 返回结果才是一个不可变数组，arr2 本身没有变化

②arr1.toBuffer 返回结果才是一个可变数组，arr1 本身没有变化

2）案例实操

object TestArrayBuffer {

def main(args: Array[String]): Unit = {

//（1）创建一个空的可变数组

val arr2 = ArrayBuffer[Int]()

//（2）追加值arr2.append(1, 2, 3)

println(arr2) // 1,2,3

//（3）ArrayBuffer ==> Array

//（3.1）arr2.toArray 返回的结果是一个新的定长数组集合

//（3.2）arr2 它没有变化

val newArr = arr2.toArray println(newArr)

//（4）Array ===> ArrayBuffer

//（4.1）newArr.toBuffer 返回一个变长数组 newArr2

//（4.2）newArr 没有任何变化，依然是定长数组val newArr2 = newArr.toBuffer newArr2.append(123)

println(newArr2)

}

大数据技术之Scala

相关资讯

热文排行

最新新闻

推荐新闻

热搜词