zoukankan      html  css  js  c++  java
  • 算法面试题:一个List<Student>,要求删除里面的男生,不用Linq和Lamda,求各种解,并说明优缺点!

    算法面试题:一个List,要求删除里面的男生,不用Linq和Lamda,求各种解,并说明优缺点!

    解题思路

    这是群里某位小伙伴去面试碰到的面试题,从题目本身来看,面试官应该是要考察面试者对泛型 List 的理解程度,也算是对基础的理解。这里面还是有很多需要考察的知识点,没关系,我们走一步看一步。

    首先,题目没有限定数量,我们知道,只谈毒性不谈剂量的都是耍流氓,那我们就假定要处理的数据有 10000 条好了。

    数据准备好了

    static readonly string text
    

    看到上面的这堆 0110 是不是有点懵逼?

    没关系,我刚看到的时候也是一样的,用下面的代码把他转换成数组就好

    List<int> students = new List<int>();
    for (int i = 0; i < text.Length; i++)
    {
        students.Add(text[i] - 48);
    }
    

    你看,事情往往就是这么简单、有趣,一个 for 循环就完美解决了我们的麻烦。

    方案一:暴力解题法

    看到这个题目,我们常常第一时间就是想到循环,遍历找出这帮真男人(1)就好了不是?

    来吧,下面就是一段暴力 for 循环

    List<int> newStudents = new List<int>();
    for (int i = 0; i < students.Count; i++)
    {
        if (students[i] == 1)
            newStudents.Add(students[i]);
    }
    

    你看,这种以暴制暴的方式往往就是这么枯燥、无趣。

    知识点来了!!!

    由于我们声明了一个 newStudents 的泛型对象,这个对象在初始化的时候,默认大小是多少?正确答案是 4 。是的,你没看错,咱 .NETCore 就是这么扣,就是任性,就给你 4 个长度的列表。

    那咱们就要问了,这 4 个是怎么装下这么多男人(1)的呢?

    动态扩容

    答案是:当我们调用 List.Add() 的时候,如果当前列表长度小于容量,即 Length < Capacity,那么数据就正常的装入列表中,如果即将装入的数据长度 + 现有的列表长度 > 容量,即 Length > Capacity,那么 List 底层就会进行自动扩容。

    每次扩容多少合适呢?翻倍!

    没错,就是这么简单有效,咱直接翻倍了,不装了,不算了,就是这么简单有效,咱就翻倍。

    看 List 的底层扩容的实现

    private void EnsureCapacity(int min) {
        if (_items.Length < min) {
            int newCapacity = _items.Length == 0? _defaultCapacity : _items.Length * 2;
            // Allow the list to grow to maximum possible capacity (~2G elements) before encountering overflow.
            // Note that this check works even when _items.Length overflowed thanks to the (uint) cast
            if ((uint)newCapacity > Array.MaxArrayLength) newCapacity = Array.MaxArrayLength;
            if (newCapacity < min) newCapacity = min;
            Capacity = newCapacity;
        }
    }
    

    重新分配内存扩容

    看上面的代码,当调用 Capacity = newCapacity;进行扩容的时候,内存将进行重新分配,具体做法就是在属性 Capacity 内部,使用 newCapacity 声明一个新的数组,然后把源数组中的内容复制到新数组中。

    public int Capacity {
        get {
            Contract.Ensures(Contract.Result<int>() >= 0);
            return _items.Length;
        }
        set {
            if (value < _size) {
                ThrowHelper.ThrowArgumentOutOfRangeException(ExceptionArgument.value, ExceptionResource.ArgumentOutOfRange_SmallCapacity);
            }
            Contract.EndContractBlock();
    
            if (value != _items.Length) {
                if (value > 0) {
                    T[] newItems = new T[value];
                    if (_size > 0) {
                        Array.Copy(_items, 0, newItems, 0, _size);
                    }
                    _items = newItems;
                }
                else {
                    _items = _emptyArray;
                }
            }
        }
    }
    

    所以,由此推断,我们一开始的暴力迭代方案将会在运行时发生多少次内存分配和 GC 呢,我们算一下,4/8/16/32/64/128/256/512/1024,算了,我算不过来了,反正就是很多很多!

    暴力修正方案

    从上面的知识点可以得知,我们应该一开始就应该声明一个合适长度的 List

    但是,我们又没有办法知道有多少男人(1)呀,那怎么办,这种时候就要逆向思维,声明一个足够大的数组,你源数据不是有 10000 条吗,那我就假定 10000 个都是男人(1),声明一个 10000 人的列表好了。

    List<int> newStudents = new List<int>(students.Count);
    for (int i = 0; i < students.Count; i++)
    {
        if (students[i] == 1)
            newStudents.Add(students[i]);
    }
    

    完美!

    方案二:算法实现

    既然是算法题,如果只考察内存和GC,那未免显得我们学识粗浅,下面我们对数据进行排序,然后再截取数组实现解题。

    冒泡排序

    我们这里使用经典的冒泡排序法,当然你可以二分或者其它,随意发挥好了。

    int total = 0;
    for (int i = 0; i < students.Count; i++)
    {
        if (i == 1)
            total++;
        for (int j = 0; j < i; j++)
        {
            if (students[j] < students[i])
            {
                var stu = students[i];
                students[i] = students[j];
                students[j] = stu;
                total++;
                break;
            }
        }
    }
    

    上面的代码实现了对数据进行排序,排序的同时不要浪费机会,借机获取了男人(1)的数量,为下面的节省内存分配做准备,既然学了就要应用是吧。

    截取数组

    int[] newStudents = new int[total];
    students.CopyTo(0, newStudents, 0, newStudents.Length);
    

    截取数组的代码非常简单,首先利用排序得到的数量声明合适的列表,然后利用 List.CopyTo() ,方法即可得到男人(1)。

    这里的 students.CopyTo() 底层实现顺便告诉大家,使用的是 Array.CopyTo()。是的,你没看错,咱

    这是 List 的底层的实现

    public void CopyTo(int index, T[] array, int arrayIndex, int count) {
        if (_size - index < count) {
            ThrowHelper.ThrowArgumentException(ExceptionResource.Argument_InvalidOffLen);
        }
        Contract.EndContractBlock();
        
        // Delegate rest of error checking to Array.Copy.
        Array.Copy(_items, index, array, arrayIndex, count);
    }
    

    本质上都是调用 Array 的方法。

    方案三:修剪法

    经过两轮磋商,相信这个时候面试官想必对你已经是刮目相看,别着急,下面还有一个方案,利用迭代列表,去修剪列表中的女人(0),剩下的自然都是男人(1)。

    for (int i = 0; i < students.Count; i++)
    {
        if (students[i] == 0)
        {
            students.RemoveAt(i);
        }
    }
    
    • 注意了,这是一段错误的代码!

    • 注意了,这是一段错误的代码!

    • 注意了,这是一段错误的代码!

    上面的修剪代码虽然看似执行了修剪女人(0)的过程,实际上,我们要了解的是,在修剪的过程中, students.Count 会随着修剪的执行过程而同时会发生改变,最终结果就是,修剪长度被缩短,导致部分女人(1)没有得到修剪检查。

    看 List.RemoveAt() 的内部实现。

    public void RemoveAt(int index) {
        if ((uint)index >= (uint)_size) {
            ThrowHelper.ThrowArgumentOutOfRangeException();
        }
        Contract.EndContractBlock();
        _size--;
        if (index < _size) {
            Array.Copy(_items, index + 1, _items, index, _size - index);
        }
        _items[_size] = default(T);
        _version++;
    }
    

    List.Count 属性的返回值正式上文中的 _size;所以,你现在明白这个方案为什么是个错误了吧。

    方案三的修正版本

    那么我们就没有办法使用修剪方案了吗?

    不是的,请年轻人先把40米的大刀收一收,我们来修正一下上面的修剪方案。

    for (int i = 0; i < students.Count; i++)
    {
        if (students[i] == 0)
        {
            students.RemoveAt(i);
            i--;
        }
    }
    

    具体做法就是在执行修剪操作后,将当前下标 i 和 students.Count 进行同步,一个小小的改动,我们实现了修剪。

    性能问题

    通过上面的三种方案,我们学习了 List 的内部执行机制,了解了内存分配和GC的回收过程,那么这三种方案的性能怎么样呢?

    是时候上图了。

    总结

    好了,今天的面试就到这里结束。

    通过上面的性能对比,我们可以看到排序方案的耗时最高,耗时高达 166ms ,而其它两个方案的耗时都为 0,当然,从内存占用来看,排序方案肯定是要优秀一些的了,但是在这个求快的时代,内存这个可怜的家伙很多时候都会被我们安排在优化的第二梯队。

    而从综合考虑,修剪方案较为可行(仅针对本题)。

  • 相关阅读:
    LeetCode "Palindrome Partition II"
    LeetCode "Longest Substring Without Repeating Characters"
    LeetCode "Wildcard Matching"
    LeetCode "Best Time to Buy and Sell Stock II"
    LeetCodeEPI "Best Time to Buy and Sell Stock"
    LeetCode "Substring with Concatenation of All Words"
    LeetCode "Word Break II"
    LeetCode "Word Break"
    Some thoughts..
    LeetCode "Longest Valid Parentheses"
  • 原文地址:https://www.cnblogs.com/viter/p/13463224.html
Copyright © 2011-2022 走看看