java相关
1.Java内存模型(JSR133 happen-before 内存重排序)
2.垃圾回收算法,弱引用和软引用的区别
标记-清除:第一步标记可以被回收的对象,然后第二步进行清除。效率和空间碎片问题。
复制:把将可用的内存分配为两块空间,分配内存时只使用其中的一块,当回收垃圾时,将存活的对象复制到另外一块,这块内存直接全部清除,目前新生代回收都是使用这种算法,HotSpot虚拟机目前将内存分为一块Eden两块Survivor,8:1:1 每次分配内存时都是使用一块Eden和一块Survivor,因为90%以上的对象都是朝生夕死,但是当surviror存不下存活的对象,回去老年代分配担保一块空间。
标记-整理:第一步标记,第二步,整理,就是让存活的对象向一端移动,然后直接清理掉内存以外的东西。
分代回收:就是对堆空间分代,把它分为新生代和老年代,对于不用的代采用不同的算法,新生代采用复制算法,老年代采用标记整理或者标记清除。
3.ConcurrenHashMap CopyOnWriteArrayList
4.volatile及原理 synchronized lock区别
synchronized 是利用操作系统内核态和用户态转换实现的同步,jvm根据这个原语在线程和临界区的各种情况作了优化,也就是偏向级锁,轻量级锁,锁膨胀,重量级锁,竞争失败一方做自旋,自旋期间如果没能获得锁,直接挂起线程。
Lock是利用AQS实现的同步功能,更多的使用CAS操作做同步,利用操作系统调用硬件指令集完成。
Lock不能代替synchronized,因为CAS有局限性,相比之下,就是Lock会灵活些。
5.死锁发生条件,举例说明
6.Java内存分区,堆分类,FullGC过程
7.泛型擦除
8.线程状态及线程状态切换(InterruptException相关的)
9.基本类型和引用类型的区别
10.深刻隆和浅克隆的区别
11.AQS 和 ReentrantLock的源码
12.HashMap的源码,jdk1.8引入红黑树
13.垃圾回收机制,gc时什么情况下会发生迁移
14.finalize会不会发生立即出发GC,finalize对象复活,System.gc()
15.java 动态代理 cglib
16.jdk cglib区别是什么?java如何实现动态代理
17.java序列化(NIO )
18.java集合类源码ArrayList LinkedList
19.LinkedHashSet TreeSet HashSet
20.并发编程过程中需要遵守的原则(原子 可见 有序)
21.fianl关键字 (同步语义)
22.Object类的方法
23.sleep和wait方法区别
24.解释下time_waiting状态。
25.hashcode和equals 为什么要有equals
26.java类加载机制(双亲委派,破坏双亲委派)
27.NIO是什么?NIO除了让开发者使用本地内存外还有什么优势?
28.线程池有哪些类型,应用场景,实现原理,线程池核心数如何设置?
29.为什么用线程池
30.对象锁,类锁的区别?
31.servlet是线程安全的嘛?(servlet的config 等等有安全有不安全)
32.java IO设计模式(装饰者)
33.内存泄露如何检测?
34.jvm优化 gc分析
35.锁的等级:方法锁,对象锁,类锁
36.手写生产者、消费者模式(wait notify)
37.泛型擦除 jvm
38.Overload和override区别
39.构造器可被override吗?
40.String stringbuilder stringbuffer
41.Collection 和Collections区别(一个接口,一个工具类)
42.servlet生命周期及各个方法
43.servlet如何自定义filter
44.jsp原理及和servlet的区别
45.java io nio aio bio
设计模式
1.单例模式,工厂模式
数据库
1.数据库索引实现原理
数据库的索引是在存储引擎层实现的,不同的存储引擎有不同的实现方法,索引一般指的是B-Tree这种数据结构,InnoDB使用的是B+树,B树指的是多路自平衡搜索树,所有键值分布在树的所有节点中,搜索有可能在非叶子节点结束,性能逼近二分搜索。B+树是B-树的变体,所有的键值都存储在叶子节点中,为所有节点增加了链指针。
为什么会使用B/B+树:
红黑树等数据结构也可以用来实现索引,但是文件系统及数据库系统普遍采用B-/+Tree作为索引结构。MySQL 是基于磁盘的数据库系统,索引往往以索引文件的形式存储的磁盘上,索引查找过程中就要产生磁盘I/O消耗,相对于内存存取,I/O存取的消耗要高几个数量级,索引的结构组织要尽量减少查找过程中磁盘I/O的存取次数。为什么使用B-/+Tree,还跟磁盘存取原理有关。
InnoDB存储引擎,B+树索引+自适应哈希索引。
B+树和B树的优缺点
B树每个索引节点都含有信息,B+数除了叶子节点外,其余的都是存储的索引,因此一次性读入内存的数据更多了,降低io次数,而且所有数据都存储在叶子节点上,查询效率更加稳定,因为叶子节点之间用过指针相连,所以范围查找更加快速,B树要实现范围查找只能进行中序遍历。
2.什么数据库索引
索引就是用来提高数据库表的访问速度的,和我们查字典的过程很象,
A)索引可以避免全表扫描。多数查询可以仅扫描少量索引页及数据页,而不是遍历所有数据页。
B)对于非聚集索引,有些查询甚至可以不访问数据页。
C)聚集索引可以避免数据插入操作集中于表的最后一个数据页。
D)一些情况下,索引还可用于避免排序操作。
3.索引的存储
一个索引包含索引项+指针,就是你指定的那个索引记录和指向数据的指针,键值+逻辑指针。
当你为一张空表创建索引时,数据库系统将为你分配一个索引页,该索引页在你插入数据前一直是空的。此页此时既是根结点,也是叶结点。每当你往表中插入一行数据,数据库系统即向此根结点中插入一行索引记录。当根结点满时,数据库系统大抵按以下步骤进行分裂:
A)创建两个儿子结点
B)将原根结点中的数据近似地拆成两半,分别写入新的两个儿子结点
C)根结点中加上指向两个儿子结点的指针
通常状况下,由于索引记录仅包含索引字段值(以及4-9字节的指针),索引实体比真实的数据行要小许多,索引页相较数据页来说要密集许多。一个索引页可以存储数量更多的索引记录,这意味着在索引中查找时在I/O上占很大的优势。
4.索引的类型
http://www.cnblogs.com/aspnethot/articles/1504082.html
http://www.cnblogs.com/hustcat/archive/2009/10/28/1591648.html
1.聚集索引:在聚集索引中,叶结点也即数据结点,所有数据行的存储顺序与索引的存储顺序一致。
2.非聚集索引:聚集索引是一种稀疏索引,数据页上一级的索引页存储的是页指针,而不是行指针。而对于非聚集索引,则是密集索引,在数据页的上一级索引页它为每一个数据行存储一条索引记录。
3.覆盖索引:索引覆盖是这样一种索引策略:当某一查询中包含的所需字段皆包含于一个索引中,此时索引将大大提高查询性能。
包含多个字段的索引,称为复合索引。索引最多可以包含31个字段,索引记录最大长度为600B。如果你在若干个字段上创建了一个复合的非聚集索引,且你的查询中所需Select字段及Where,Order By,Group By,Having子句中所涉及的字段都包含在索引中,则只搜索索引页即可满足查询,而不需要访问数据页。由于非聚集索引的叶结点包含所有数据行中的索引列值,使用这些结点即可返回真正的数据,这种情况称之为“索引覆盖”。
5.索引的优缺点
索引加快数据库的检索速度
索引降低了插入、删除、修改等维护任务的速度
唯一索引可以确保每一行数据的唯一性
通过使用索引,可以在查询的过程中使用优化隐藏器,提高系统的性能
索引需要占物理和数据空间
6.数据库连接
连接就是将数据库表中的其他列添加进来,进行添加列的集合运算,内连接和外连接。
inner join:只能选取出同时存在两张表中的数据。
outer join:只要数据存储在某一张表中,就能读取出来。选取出单张表中的全部信息。
outer join:还涉及一个概念,就是以哪个表作为连接的主表,
left outer join, right outer join. 外连接中使用left outer join, right outer join 得到的结果完全相同。
7.数据库左连接,右连接
就是在外连接中,可以指定哪个表作为主表。left outer join right outer join.
8.什么是事务
事务(Transaction)是并发控制的基本单位。所谓的事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。事务是数据库维护数据一致性的单位,在每个事务结束时,都能保持数据一致性。
事务的四个特性:ACID
8.1.原子性:是指事务是不可分割的最小单元,整个事务的所有操作要么执行成功,要么全部失败回滚。
8.2.一致性:是指事务总是从一个一致性的状态转移到另外一个一致性的状态。
8.3.隔离性:一个事务在没有提交之前,对于其他事务是不可见的,事务的隔离有四个级别。务允许多个用户对同一个数据进行并发访问,而不破坏数据的正确性和完整性。同时,并行事务的修改必须与其他并行事务的修改相互独立。
a.未提交读:事务中的修改,即使没提交也是可以读到的,这种称为脏读。
b.提交读:一个事务从开始到提交之前,对其他事务是不可见的,这个级别有时候也称为不可重复读,因为两次执行同样的查询可能会出现不同的结果。
c.可重复读:该级别保证了多次读取同样的记录时是同一个值,但是这个级别无法解决幻读的问题,幻读是指,当一个事务在某个范围内读取值时,然后其他事务又在这个范围内插入新值,然后再次读取这个值的时候,就会出现新的记录,产生幻行,InooDB通过多版本并发控制MVCC解决了幻读问题。MySql的默认隔离级别
d.可串行化:通过每一行数据加锁,然后强制事务串行执行,最高的隔离级别。
8.4.持久性:一旦事务提交,则其所做的所有修改就会永久的保持在数据库中。
9.mysql存储引擎
http://www.jianshu.com/p/a957b18ba40d
InnoDB:支持事物处理。
MyISAM:在mysql 5.1之前,MyISAM是默认的存储引擎,但是MyISAM不支持事务和行级锁,崩溃后无法安全恢复,
10.mysql中的锁策略
当多个查询需要在同一时刻修改数据,就会产生并发控制问题,数据库管理系统中的并发控制是指当多个事务同时存取同一数据时,不破坏事务的隔离性和统一性及数据库的完整性。共享锁(读锁),排它锁(写锁)。
表锁:是mysql中最基本的锁策略,并且是开销最小的所策略,就是对整张表进行锁定。
行级锁:锁定表中的某一行,最大程度的支持并发处理,但是也带来最大的锁开销,InnoDB支持行级锁。
多版本并发控制MVCC:MySQL中的存储引擎不仅仅是简单的行级锁,为了提高并发访问的性能,一般都实现了多版本并发控制,不同的存储引擎实现MVCC的方式是不同的,典型的有乐观的并发控制和悲观的并发控制。
MVCC是行级锁的一个变种,但是在很多情况下避免了加锁操作,因此开销更低,但是大多数都实现了非阻塞的读操作,写操作也是锁定必要的行。
InnoDB中MVCC的实现:InnoDB是通过在每行记录的后边添加两个隐藏列来实现的,一个是保存了行的创建时间,一个保存了行的过期时间,存储的不是时间值,而是系统的版本号,没开始一个新的事务,系统版本号都会自动递增。
可重复读隔离级别下,MVCC是具体如何操作的
SELECT
InnoDB会根据以下两个条件检查每行记录:
a.只查找版本号早于当前事务的版本号的行,这样可以保证事务读取的行,要么是事务开始之前存在的,要么是事务自身插入或修改过的。
b.行的删除版本号要么未定义,要么大于当前的事务版本号,这可以确保读取到事务的行,在读取之前不会被删除。
INSERT:
InnoDB为新插入的每一行保存当前系统版本号作为行版本号。
保存这两个版本号,使得读操作都可以不用加锁,不足之处需要额外的存储空间,MVCC只在提交读和可重复读的隔离级别下工作。
11.数据库范式
第一范式:字段是最小的单元,不可再分。
第二范式:满足第一范式,而且表中的其他字段必须依赖于主键。
第三范式:满足第二范式,非主键外的所有字段必须互补依赖。
12.范式和反范式的优缺点
范式化的优点:
a.范式化的更新操作比反范式要快。
b.当数据较好的范式化时,没有重复数据。
c.范式化的表通常更小,更容易放在内存中,所以执行操作会更快。
d.很少有多余的数据意味着检索列表时更少需要DISTINCT和GROUP BY语句。
范式化的缺点:
范式化的数据库表,在查询时通常需要关联。
反范式化的优点:
a.避免关系表查询。
反范式化的缺点:
数据冗余。
13.连接池原理,乐观锁,悲观锁
http://www.open-open.com/lib/view/open1452046967245.html
a.数据库连接池和java线程池原理相同,都是预定义一些线程,等待连接,通过设置参数控制线程数量,这样避免频繁的启动和关闭线程和无限制的创建线程所带来的系统开销,实现原理,使用阻塞队列来实现。设置corePoolSize maxPoolSize。
b.乐观锁(乐观并发控制):
它假设多用户并发的事务在处理时不会彼此互相影响,各事务能够在不产生锁的情况下处理各自影响的那部分数据。在提交数据更新之前,每个事务会先检查在该事务读取数据后,有没有其他事务又修改了该数据。如果其他事务有更新的话,正在提交的事务会进行回滚。
乐观锁( Optimistic Locking ) 相对悲观锁而言,乐观锁假设认为数据一般情况下不会造成冲突,所以在数据进行提交更新的时候,才会正式对数据的冲突与否进行检测,如果发现冲突了,则让返回用户错误的信息,让用户决定如何去做。
c.悲观锁(悲观并发控制):
如果一个事务执行的操作都某行数据应用了锁,那只有当这个事务把锁释放,其他事务才能够执行与该锁冲突的操作。悲观并发控制主要用于数据争用激烈的环境,以及发生并发冲突时使用锁保护数据的成本要低于回滚事务的成本的环境中。
悲观锁操作流程:先加锁,在操作,然后释放锁。
悲观锁的优缺点
悲观并发控制实际上是“先取锁再访问”的保守策略,为数据处理的安全提供了保证。但是在效率方面,处理加锁的机制会让数据库产生额外的开销,还有增加产生死锁的机会;另外,在只读型事务处理中由于不会产生冲突,也没必要使用锁,这样做只能增加系统负载;还有会降低了并行性,一个事务如果锁定了某行数据,其他事务就必须等待该事务处理完才可以处理那行数。
14.sql注入 如何预防
15.sql性能优化
16.redis存储结构
17.慢查询
18.间隙锁 **
19.存储过程**
存储过程就是预编译的sql语句,
1.存储过程就是预编译的sql代码块,执行效率高,给存储过程取个名字,在别处直接调用就好了
2.一个存储过程替代大量T_SQL语句 ,可以降低网络通信量,提高通信速率
3.可以一定程度上确保数据安全
Spring
1.Spring框架特征,IOC控制反转,注入和单例的差别
2.Spring AOP 场景和底层实现
3.注入方式
4.Spring支持事物,如何管理?(源码)
5.Spring如何实现ioc
6.Spring Dao那种设计模式用的最多?
7.Spring mvc用过哪些注解
8.spring bean加载过程
9.redis 和 memcached 区别
10.分布式锁
操作系统
1.操作系统自旋锁怎么实现?
2.kill进程杀不掉的原因? kill -9 -9是什么意思?
3.linux文件权限(rwx 421)
4.linux内存使用情况 进行调度 常用命令
5.死锁条件 预防
网络
1.HTTP状态码?301 302区别
2.tcp三次握手,为什么三次握手
3.tcp四次挥手,为什么四次挥手?断开之后马上重新连接吗?不是的话,等多久?
4.为什么需要长连接?怎样实现?
5.cookie原理,如果服务器是分布式的,怎样应对Session一致性问题?
6.osi七层模型,
7.浏览器访问一个网址的过程,
8.tcp拥塞控制,滑动窗口 回退N指针协议?
9.Ping过程,icmp报文?
10.redict 和 forward区别?
数据结构
1.链表手写 CLH队列为例子说了下双向链表的队列怎么写?
2.Hash冲突如何解决
3.什么是平衡二叉树,红黑树,什么地方用到红黑树,怎样实现红黑树?
4.迪杰特斯拉算法,就是最短路径的那个,图在内存中怎么存储,
5.一个大文件中数据排序,内存一次放不下,怎么实现?
(哈希 + 排序 + 归并 + 最小堆)
6.判断32位整数是不是4的幂?先判断是不是2的幂?然后在判断4的幂,将树与0X5555555与,非0则是。
7.一个文本文件每一行都有一个url,有一万行,统计每一个url出现的次数,(hash就可以了)
其他xx鬼知道的框架
1.Netty
2.kafka
3.分布式。