O Tipo Slice

Slices permitem referenciar uma sequência contígua de elementos em uma coleção. Um slice é um tipo de referência e, portanto, não tem ownership.

Aqui está um pequeno problema de programação: escreva uma função que receba uma string composta por palavras separadas por espaços e retorne a primeira palavra que encontrar nessa string. Se a função não encontrar um espaço na string, então a string inteira deve ser considerada uma única palavra e, nesse caso, a string inteira deve ser retornada.

Observação: para fins de introdução a slices, nesta seção vamos assumir apenas ASCII; uma discussão mais completa sobre tratamento de UTF-8 aparece na seção “Armazenando Texto Codificado em UTF-8 com Strings” do Capítulo 8.

Vamos ver como escreveríamos a assinatura dessa função sem usar slices, para entender o problema que eles resolvem:

fn first_word(s: &String) -> ?

A função first_word recebe um parâmetro do tipo &String. Não precisamos de ownership, então isso está ótimo. Em Rust idiomático, funções não assumem ownership de seus argumentos a menos que precisem, e as razões para isso vão ficar mais claras conforme avançarmos. Mas o que deveríamos retornar? Na verdade, não temos uma forma de falar sobre parte de uma string. No entanto, podemos retornar o índice do fim da palavra, indicado por um espaço. Vamos tentar isso, como mostrado na Listagem 4-7.

Filename: src/main.rs

fn first_word(s: &String) -> usize {
    let bytes = s.as_bytes();

    for (i, &item) in bytes.iter().enumerate() {
        if item == b' ' {
            return i;
        }
    }

    s.len()
}

fn main() {}

Listing 4-7: A função first_word que retorna um índice de byte dentro do parâmetro String

Como precisamos percorrer a String elemento por elemento e verificar se um byte corresponde a um espaço, vamos converter nossa String em um array de bytes usando o método as_bytes.

fn first_word(s: &String) -> usize {
    let bytes = s.as_bytes();

    for (i, &item) in bytes.iter().enumerate() {
        if item == b' ' {
            return i;
        }
    }

    s.len()
}

fn main() {}

Em seguida, criamos um iterador sobre esse array de bytes usando o método iter:

fn first_word(s: &String) -> usize {
    let bytes = s.as_bytes();

    for (i, &item) in bytes.iter().enumerate() {
        if item == b' ' {
            return i;
        }
    }

    s.len()
}

fn main() {}

Discutiremos iteradores em mais detalhes no Capítulo 13. Por enquanto, saiba que iter é um método que retorna cada elemento de uma coleção, e que enumerate envolve o resultado de iter e retorna cada elemento como parte de uma tupla. O primeiro elemento da tupla retornada por enumerate é o índice, e o segundo é uma referência ao elemento. Isso é um pouco mais conveniente do que calcular o índice por conta própria.

Como o método enumerate retorna uma tupla, podemos usar padrões para desestruturar essa tupla. Vamos falar mais sobre padrões no Capítulo 6. No loop for, especificamos um padrão que usa i para o índice na tupla e &item para o byte individual da tupla. Como recebemos uma referência ao elemento de .iter().enumerate(), usamos & no padrão.

Dentro do loop for, procuramos o byte que representa o espaço usando a sintaxe de literal de byte. Se encontrarmos um espaço, retornamos sua posição. Caso contrário, retornamos o comprimento da string usando s.len().

fn first_word(s: &String) -> usize {
    let bytes = s.as_bytes();

    for (i, &item) in bytes.iter().enumerate() {
        if item == b' ' {
            return i;
        }
    }

    s.len()
}

fn main() {}

Agora temos uma forma de descobrir o índice do fim da primeira palavra da string, mas há um problema. Estamos retornando um usize por conta própria, mas ele só é um número significativo no contexto da &String. Em outras palavras, como ele é um valor separado da String, não há garantia de que continuará válido no futuro. Considere o programa da Listagem 4-8, que usa a função first_word da Listagem 4-7.

Filename: src/main.rs

fn first_word(s: &String) -> usize {
    let bytes = s.as_bytes();

    for (i, &item) in bytes.iter().enumerate() {
        if item == b' ' {
            return i;
        }
    }

    s.len()
}

fn main() {
    let mut s = String::from("hello world");

    let word = first_word(&s); // word will get the value 5

    s.clear(); // this empties the String, making it equal to ""

    // word still has the value 5 here, but s no longer has any content that we
    // could meaningfully use with the value 5, so word is now totally invalid!
}

Listing 4-8: Armazenando o resultado de chamar first_word e depois alterando o conteúdo da String

Esse programa compila sem erro algum e também continuaria compilando se usássemos word depois da chamada a s.clear(). Como word não está ligado ao estado de s, ele ainda contém o valor 5. Poderíamos usar esse valor 5 junto com a variável s para tentar extrair dela a primeira palavra, mas isso seria um bug, porque o conteúdo de s mudou desde que salvamos 5 em word.

Ter de se preocupar com o índice em word ficando fora de sincronia com os dados em s é tedioso e propenso a erros! Gerenciar esses índices fica ainda mais frágil se escrevermos uma função second_word. A assinatura dela teria de ser algo assim:

fn second_word(s: &String) -> (usize, usize) {

Agora estamos acompanhando um índice de início e um de fim, e temos ainda mais valores calculados a partir de dados em um estado específico, mas que não estão ligados a esse estado de forma alguma. Temos três variáveis soltas e sem relação direta, que precisam permanecer sincronizadas.

Felizmente, o Rust tem uma solução para esse problema: string slices.

String Slices

Um string slice é uma referência a uma sequência contígua de elementos de uma String, e ele se parece com isto:

fn main() {
    let s = String::from("hello world");

    let hello = &s[0..5];
    let world = &s[6..11];
}

Em vez de ser uma referência para a String inteira, hello é uma referência para uma parte da String, especificada pelo trecho adicional [0..5]. Criamos slices usando um intervalo entre colchetes, especificando [starting_index..ending_index], em que starting_index é a primeira posição do slice e ending_index é uma posição além da última. Internamente, a estrutura de dados do slice armazena a posição inicial e o comprimento do slice, que corresponde a ending_index menos starting_index. Assim, no caso de let world = &s[6..11];, world seria um slice contendo um ponteiro para o byte no índice 6 de s com um valor de comprimento igual a 5.

A Figura 4-7 mostra isso em um diagrama.

Three tables: a table representing the stack data of s, which points
to the byte at index 0 in a table of the string data "hello world" on
the heap. The third table represents the stack data of the slice world, which
has a length value of 5 and points to byte 6 of the heap data table.

Figura 4-7: Um string slice referindo-se a uma parte de String

Com a sintaxe de intervalo .. do Rust, se você quiser começar do índice 0, pode omitir o valor antes dos dois pontos. Em outras palavras, estes dois trechos são equivalentes:

#![allow(unused)]
fn main() {
let s = String::from("hello");

let slice = &s[0..2];
let slice = &s[..2];
}

Da mesma forma, se o seu slice incluir o último byte da String, você pode omitir o número final. Isso significa que estes trechos são equivalentes:

#![allow(unused)]
fn main() {
let s = String::from("hello");

let len = s.len();

let slice = &s[3..len];
let slice = &s[3..];
}

Você também pode omitir ambos os valores para pegar um slice da string inteira. Logo, estes trechos também são equivalentes:

#![allow(unused)]
fn main() {
let s = String::from("hello");

let len = s.len();

let slice = &s[0..len];
let slice = &s[..];
}

Observação: os índices de intervalo de string slices precisam estar em limites válidos de caracteres UTF-8. Se você tentar criar um string slice no meio de um caractere multibyte, seu programa será encerrado com erro.

Com todas essas informações em mente, vamos reescrever first_word para retornar um slice. O tipo que representa um string slice é escrito como &str:

Filename: src/main.rs

fn first_word(s: &String) -> &str {
    let bytes = s.as_bytes();

    for (i, &item) in bytes.iter().enumerate() {
        if item == b' ' {
            return &s[0..i];
        }
    }

    &s[..]
}

fn main() {}

Obtemos o índice do fim da palavra da mesma forma que fizemos na Listagem 4-7, procurando a primeira ocorrência de um espaço. Quando encontramos um espaço, retornamos um string slice usando o início da string e o índice do espaço como índices inicial e final.

Agora, quando chamamos first_word, recebemos de volta um único valor ligado aos dados subjacentes. O valor é composto por uma referência ao ponto inicial do slice e pelo número de elementos do slice.

Retornar um slice também funcionaria para uma função second_word:

fn second_word(s: &String) -> &str {

Agora temos uma API simples e muito mais difícil de usar incorretamente, porque o compilador garante que as referências para dentro da String continuem válidas. Lembra do bug no programa da Listagem 4-8, quando obtivemos o índice do fim da primeira palavra, mas depois limpamos a string e, com isso, esse índice ficou inválido? Aquele código estava logicamente incorreto, mas não mostrava nenhum erro imediatamente. Os problemas só apareceriam depois, se continuássemos tentando usar o índice da primeira palavra com uma string já esvaziada. Slices tornam esse bug impossível e nos avisam muito mais cedo de que há um problema no código. Usar a versão com slice de first_word vai gerar um erro de compilação:

Filename: src/main.rs

fn first_word(s: &String) -> &str {
    let bytes = s.as_bytes();

    for (i, &item) in bytes.iter().enumerate() {
        if item == b' ' {
            return &s[0..i];
        }
    }

    &s[..]
}

fn main() {
    let mut s = String::from("hello world");

    let word = first_word(&s);

    s.clear(); // error!

    println!("the first word is: {word}");
}

Este é o erro do compilador:

$ cargo run
   Compiling ownership v0.1.0 (file:///projects/ownership)
error[E0502]: cannot borrow `s` as mutable because it is also borrowed as immutable
  --> src/main.rs:18:5
   |
16 |     let word = first_word(&s);
   |                           -- immutable borrow occurs here
17 |
18 |     s.clear(); // error!
   |     ^^^^^^^^^ mutable borrow occurs here
19 |
20 |     println!("the first word is: {word}");
   |                                   ---- immutable borrow later used here

For more information about this error, try `rustc --explain E0502`.
error: could not compile `ownership` (bin "ownership") due to 1 previous error

Lembre-se, pelas regras de borrowing, que se temos uma referência imutável para alguma coisa, também não podemos pegar uma referência mutável para essa mesma coisa. Como clear precisa truncar a String, ele precisa obter uma referência mutável. O println! após a chamada a clear usa a referência em word, então a referência imutável ainda precisa estar ativa naquele ponto. O Rust proíbe que a referência mutável em clear e a referência imutável em word existam ao mesmo tempo, e a compilação falha. O Rust não apenas tornou nossa API mais fácil de usar como também eliminou toda uma classe de erros em tempo de compilação!

Literais de String como Slices

Lembre-se de que falamos sobre literais de string serem armazenados dentro do binário. Agora que sabemos sobre slices, conseguimos entender corretamente os literais de string:

#![allow(unused)]
fn main() {
let s = "Hello, world!";
}

O tipo de s aqui é &str: é um slice apontando para aquele ponto específico do binário. Essa é também a razão pela qual literais de string são imutáveis: &str é uma referência imutável.

String Slices como Parâmetros

Saber que você pode obter slices de literais e de valores String nos leva a mais uma melhoria em first_word, que é sua assinatura:

fn first_word(s: &String) -> &str {

Um rustaceano mais experiente escreveria a assinatura mostrada na Listagem 4-9, porque ela nos permite usar a mesma função tanto com valores &String quanto com valores &str.

fn first_word(s: &str) -> &str {
    let bytes = s.as_bytes();

    for (i, &item) in bytes.iter().enumerate() {
        if item == b' ' {
            return &s[0..i];
        }
    }

    &s[..]
}

fn main() {
    let my_string = String::from("hello world");

    // `first_word` works on slices of `String`s, whether partial or whole.
    let word = first_word(&my_string[0..6]);
    let word = first_word(&my_string[..]);
    // `first_word` also works on references to `String`s, which are equivalent
    // to whole slices of `String`s.
    let word = first_word(&my_string);

    let my_string_literal = "hello world";

    // `first_word` works on slices of string literals, whether partial or
    // whole.
    let word = first_word(&my_string_literal[0..6]);
    let word = first_word(&my_string_literal[..]);

    // Because string literals *are* string slices already,
    // this works too, without the slice syntax!
    let word = first_word(my_string_literal);
}

Listing 4-9: Melhorando a função first_word ao usar um string slice como tipo do parâmetro s

Se tivermos um string slice, podemos passá-lo diretamente. Se tivermos uma String, podemos passar um slice da String ou uma referência à String. Essa flexibilidade aproveita coerções de deref, um recurso que veremos na seção “Usando Coerções de Deref em Funções e Métodos” do Capítulo 15.

Definir uma função para receber um string slice em vez de uma referência para String torna nossa API mais geral e mais útil, sem perder nenhuma funcionalidade:

Filename: src/main.rs

fn first_word(s: &str) -> &str {
    let bytes = s.as_bytes();

    for (i, &item) in bytes.iter().enumerate() {
        if item == b' ' {
            return &s[0..i];
        }
    }

    &s[..]
}

fn main() {
    let my_string = String::from("hello world");

    // `first_word` works on slices of `String`s, whether partial or whole.
    let word = first_word(&my_string[0..6]);
    let word = first_word(&my_string[..]);
    // `first_word` also works on references to `String`s, which are equivalent
    // to whole slices of `String`s.
    let word = first_word(&my_string);

    let my_string_literal = "hello world";

    // `first_word` works on slices of string literals, whether partial or
    // whole.
    let word = first_word(&my_string_literal[0..6]);
    let word = first_word(&my_string_literal[..]);

    // Because string literals *are* string slices already,
    // this works too, without the slice syntax!
    let word = first_word(my_string_literal);
}

Outros Slices

String slices, como você pode imaginar, são específicos para strings. Mas existe também um tipo mais geral de slice. Considere este array:

#![allow(unused)]
fn main() {
let a = [1, 2, 3, 4, 5];
}

Assim como podemos querer nos referir a parte de uma string, podemos querer nos referir a parte de um array. Faríamos isso assim:

#![allow(unused)]
fn main() {
let a = [1, 2, 3, 4, 5];

let slice = &a[1..3];

assert_eq!(slice, &[2, 3]);
}

Esse slice tem o tipo &[i32]. Ele funciona da mesma maneira que string slices, armazenando uma referência ao primeiro elemento e um comprimento. Você usará esse tipo de slice para vários outros tipos de coleção. Vamos discutir essas coleções em detalhe quando falarmos sobre vetores no Capítulo 8.

Resumo

Os conceitos de ownership, borrowing e slices garantem segurança de memória em programas Rust em tempo de compilação. A linguagem Rust dá a você controle sobre o uso da memória da mesma forma que outras linguagens de programação de sistemas. Mas ter o dono dos dados limpando automaticamente esses dados quando ele sai de escopo significa que você não precisa escrever e depurar código extra para obter esse controle.

Ownership afeta o funcionamento de muitas outras partes do Rust, então vamos falar mais sobre esses conceitos ao longo do restante do livro. Vamos agora para o Capítulo 5 e ver como agrupar pedaços de dados em uma struct.

Keyboard shortcuts

A Linguagem de Programação Rust (PT-BR)

O Tipo Slice

String Slices

Literais de String como Slices

String Slices como Parâmetros

Outros Slices

Resumo