《算法通关村——位运算在查找重复元素中的妙用》

本文介绍: 在海量数据中，此时普通的数组、链表、Ha sh、树等等结构有无效了，因为内存空间放不下了。而常规的递归、排序，回溯、贪心和动态规划等思想也无效了，因为执行都会超时，必须另外想办法。这类问题该如何下手呢？

在海量数据中，此时普通的数组、链表、Ha sh、树等等结构有无效了，因为内存空间放不下了。而常规的递归、排序，回溯、贪心和动态规划等思想也无效了，因为执行都会超时，必须另外想办法。这类问题该如何下手呢？这里介绍三种非常典型的思路：

分析：本身是一道海量数据问题的热身题，如果去掉“只有4KB”的要求，我们可以先创建一个大小为N的数组，然后将这些数据放进来，但是整数最大为32000。如果直接采用数组存，则应该需要32000*4B=128KB的空间，而题目有4KB的内存限制，我们就必须先解决该如何存放的问题。

如果只有4KB的空间，那么只能寻址8*4*2^10个比特，这个值比32000要大的，因此我们可以创建32000比特的位向量(比特数组)，其中一个比特位置就代表一个整数。

利用这个位向量，就可以遍历访问整个数组。如果发现数组元素是v，那么就将位置为v的设置为1，碰到重复元素，就输出一下。

package Algorithm15;

public class FindRepeatedNum {
    static class BitSet {
        private int[] bitSet;
        BitSet(int size){
            bitSet = new int[size &gt;&gt; 5];
        }
        public int get(int position){
            int wordNum = position &gt;&gt; 5; // 计算数据在数组中的哪一个位置
            int bitNum = position % 32; // 计算数据在某个位置的那个比特位，这两个操作就能够满足把某一个数据进行存在与否的设定。
            return bitSet[wordNum] &amp; (1<<bitNum);
        }
        public void set(int position){
            int wordNum = position &gt;&gt; 5;
            int bitNum = position % 32;
            bitSet[wordNum] |= (1<<bitNum);
        }
    }
    public static void findRepeatedNum(int[] nums){
        BitSet bitSet = new BitSet(32000);
        for(int num :nums){
            int position = num - 1;
            if(bitSet.get(position) != 0){
                System.out.println(num);
            }else{
                bitSet.set(position);
            }
        }
    }

    public static void main(String[] args) {
        findRepeatedNum(new int[]{1,1,5,6,8,3,23,6,23,8});
    }
}