top 30 sas interview questions
Список найпопулярніших запитань щодо інтерв’ю з відповідями SAS:
У цій статті ми розглянемо деякі основні, а також вдосконалені концепції програмування SAS через найбільш часто задавані запитання та відповіді на інтерв’ю SAS.
Система статистичного аналізу, широко відома як SAS, розглядається як сукупність безлічі програмного забезпечення, яке інтегровано та використовується для різних операцій, таких як управління даними, прогнозування - перспективний та описовий аналіз, поліпшення якості, бізнес-аналіз, розробка додатків тощо.
Велика кількість налаштувань компонентів SAS, а також розширена функція підходу до програмування разом виконують завдання аналізу даних і перетворення даних. Він може працювати в будь-якій операційній системі (Linux, Windows тощо), оскільки не залежить від платформи.
Найпопулярніші запитання та відповіді на інтерв’ю SAS
Ось і ми..
Q # 1) Перерахуйте функції, які виконує SAS.
Відповідь: SAS (Система статистичного аналізу) має своє значення в кожному бізнесі.
Нижче наведено деякі узагальнені функції, які виконує SAS:
- Управління даними та управління проектами
- Зберігання даних
- Оперативні дослідження та підтримка прийняття рішень
- Пошук інформації та управління якістю
- Бізнес-планування
- Статистичний аналіз
Q # 2) Які 3 компоненти в програмуванні SAS?
Відповідь: 3 компоненти програмування SAS:
- Заяви
- Змінні
- Набір даних
Q # 3) Запишіть правила синтаксису, яких дотримуються в операторах SAS.
Відповідь: Програма SAS написана у вікні редактора. Тут він містить ряд тверджень, за якими слід відповідний синтаксис для того, щоб програма SAS зрозуміла його.
Деякі правила синтаксису, яких дотримуються у випадку компонента Statement SAS, є такими:
- Кінець будь-якого твердження позначається крапкою з комою (;).
- Точка з комою також використовується для відокремлення декількох тверджень, які з’являються в одному рядку.
- Інструкції SAS не чутливі до регістру та зайвий інтервал перед автоматичним видаленням операторів.
- Коментарі можуть бути включені в програму SAS щодо висловлювань двома різними способами:
- Рядок, що починається зірочкою (*) і закінчується крапкою з комою (;).
- Рядок, що починається з косою рискою та зірочкою (/ *) і закінчується зірочкою та косою рискою (* /).
Q # 4) Які типи даних містить SAS?
Відповідь: «Числовий» і «Персонаж» це два типи типів даних, які містить програма SAS.
Q # 5) Що таке ПДВ та їх функції?
Відповідь: Вектор програмних даних (ПДВ) є логічним поняттям і визначається як область пам'яті, де SAS будує набір даних.
Функції ПДВ такі:
- Створюється база даних з одним спостереженням одночасно.
- Вхідний буфер для зберігання даних із зовнішнього файлу створюється під час компіляції.
- PDV містить дві автоматичні змінні, а саме: _N_ (відображає кількість етапу даних, що виконується) та _ERROR_ (повідомляє про помилку, що виникає під час виконання).
Q # 6) Що ви знаєте про набір даних SAS?
Відповідь: Набір даних SAS в основному називають даними, доступними для аналізу в рамках програми SAS. Набір даних SAS також називається таблицею даних SAS.
Таблиця даних SAS складається з двох частин:
- Стовпці змінних
- Рядки спостережень
Корисну інформацію про набір даних SAS можна узагальнити наступним чином:
- Набір даних SAS може читати, а також має вбудовані джерела даних для використання, такі як Excel, Access тощо.
- Набір даних, який використовується лише під час поточного запуску сеансу та відкидається після закінчення сеансу, називається тимчасовим набором даних.
- Набір даних, який зберігається для використання в майбутньому сеансі, також відомий як постійний набір даних.
- За допомогою цього шляху можна отримати доступ до вбудованого набору даних Бібліотеки -> Мої бібліотеки-> SASHELP.
Q # 7) Поясніть, чому подвійне завершення @@ використовується у вхідних виписках?
Відповідь: Під час ітерації кроку даних, включаючи подвійне завершення @@ в операторах введення, передбачається, що SAS повинен зберігати поточний запис з метою виконання наступного оператора введення, а не перемикатися на новий запис.
Q # 8) Поясніть різницю між параметрами NODUP та NODUPKEY?
Відповідь: Щоб видалити повторювані значення з таблиці, PROC SORT в основному поділяється на два варіанти:
- NODUP
- НОДУПКЕЙ
Різницю між цими двома варіантами можна побачити нижче:
НОДУПКЕЙ | NODUP |
---|---|
Порівнює лише змінну BY, присутню в наборі даних. | Порівнює всі змінні, наявні в наборі даних. |
Видаляє повторювані параметри значень змінної, перелічених у операторі BY. | Виявляє та усуває повторювані спостереження. |
Синтаксис: PROC SORT DATA = readin NODUPKEY; За назвою змінної; БІГАТИ; | Синтаксис: PROC SORT DATA = readin NODUP; За назвою змінної; БІГАТИ; |
Q # 9) Яка команда використовується для сортування в програмі SAS?
Відповідь: Команда PROC SORT використовується для здійснення сортування, будь то для однієї змінної або декількох змінних. Ця команда виконується на наборі даних, де новий набір даних створюється в результаті сортування, але вихідний набір даних залишається незмінним.
Синтаксис:
PROC SORT DATA=original OUT=Sorted; BY variable;
Де,
'Оригінал' відноситься до оригінального набору даних
„Відсортовано” означає результат як відсортований набір даних
«Змінна» відноситься до стовпця, над яким виконується операція сортування.
Сортування може здійснюватися як за зростанням, так і за спаданням.
Для відображення набору даних у порядку зменшення в операторі BY використовується ключове слово «За спаданням» із назвою стовпця, за яким слід виконати сортування.
PROC SORT DATA=original OUT=Sorted; BY DESCENDING variable
Q # 10) Поясніть різницю між інформацією та форматом на прикладі.
Відповідь: Різницю між інформацією та форматом можна пояснити так:
Дізнатися більше | Формат |
---|---|
Вкажіть SAS, як читати дані у змінну SAS. | Вкажіть SAS, як відображати значення у змінній. |
Вони використовуються для зчитування даних або отримання вхідних даних із зовнішніх файлів. | Вони використовуються для запису даних. |
Q # 11) Диференціюйте INPUT та INFILE.
Відповідь: Включення оператора INFILE в програмування SAS ідентифікує зовнішній файл, який складається з даних, тоді як включення оператора INPUT у програмування SAS описує використовувані змінні.
Синтаксис для INFILE:
INFILE ‘filename’;
Синтаксис для INPUT:
INPUT ‘varname1’ ‘varname2’;
Q # 12) Поясніть використання PROC друку та вмісту PROC?
Відповідь: Крок PROC програми SAS використовується для виклику вбудованих процедур аналізу даних набору даних.
PROC друк: Переконує, що дані, що містяться в наборі даних, читаються правильно.
Зміст PROC: Відображає інформацію про набір даних SAS.
Q # 13) Поясніть DATA_NULL_?
Відповідь: Як випливає з назви, DATA_NULL_ - це крок даних, який насправді не створює жодного набору даних.
Він використовується для:
- Створення макрозмінних.
- Запис вихідних даних без будь-якого набору даних.
Q # 14) Як символьна змінна перетворюється на числову змінну і навпаки?
Відповідь: У рамках програмування SAS виникає багато завдань, де значення символу має бути перетворено в числове, і таким же чином числове значення має бути перетворене в значення символу.
ВСТАНОВИТИ () використовується для перетворення числового в символьний. У цьому випадку вихідний формат та тип змінної джерела завжди повинні бути подібними.
Приклад:
char_var= PUT( num_var, 6.);
INPUT () використовується для перетворення символу в числовий. У цьому випадку типом вихідної змінної завжди повинні бути символьні змінні.
Приклад:
Num_var= INPUT(char_var,2.0);
Q # 15) Яка мета _CHARACTER_ та _NUMERIC_?
Відповідь: У поточному наборі даних
_CHARACTER_ визначає всі змінні символи, які визначені на даний момент.
Приклад : Для включення всіх змінних символів у PROC MEANS використовуються такі твердження:
PROC MEANS; Var_character_; Run;
_NUMERIC_ визначає всі числові змінні, які визначені на даний момент.
Приклад: Для включення всіх числових змінних до PROC MEANS використовуються такі твердження:
PROC MEANS; Var_numeric_; Run;
Q # 16) Які команди використовуються у разі включення або виключення будь-яких конкретних змінних до набору даних?
Відповідь: Для цього використовуються опції DROP, KEEP та набір даних.
Змінна, яку ми хочемо вилучити з кроку даних, зазначена в операторі DROP.
Змінна, яку ми хочемо зберегти на етапі даних, зазначена в операторі KEEP.
Q # 17) Диференціюйте PROC MEANS та PROC SUMMARY.
Відповідь: Різницю між PROC MEANS та PROC SUMMARY можна зрозуміти наступним чином:
ЗАСОБ ПРОЦЕСУ | РЕЗЮМЕ ПРОЦЕСУ |
---|---|
Ця процедура створює друкований звіт за замовчуванням у вікні ВИХІД. | Ця процедура включає PRINT у заяву для виготовлення друкованого звіту. |
PROC MEANS за замовчуванням бере всі числові змінні в аналізі. | PROC SUMMARY бере змінні в статистичний аналіз, що описані у заяві VAR. |
Q # 18) Поясніть призначення функцій SUBSTR у програмуванні SAS.
Відповідь: У програмуванні SAS, коли є потреба програми абстрагувати підрядок, у випадку символьної змінної використовується функція SUBSTR.
Коли вказано початкову позицію та довжину, ця функція використовується для абстрагування символьного рядка.
Синтаксис: SUBSTR (char_var, початок, довжина);
Q # 19) Назвіть і опишіть кілька функцій символів SAS, які коротко використовуються для очищення даних.
Відповідь: Нижче наведено кілька функцій символів SAS, які використовуються для очищення даних:
- Стиснути (char_string) Функція використовується для видалення пробілів або деяких вказаних символів із заданого рядка.
- TRIM (str) Функція використовується для видалення порожніх пробілів із заданого рядка.
- LOWCASE (char_string) Функція використовується для перетворення всіх символів заданого рядка в малі.
- UPCASE (char_string) Функція використовується для перетворення всіх символів у даному рядку у великі регістри.
- COMPBL (str) Функція використовується для перетворення декількох порожніх місць в одну порожню.
Q # 20) Згадайте кілька способів, за допомогою яких 'пошук таблиці' виконується в програмуванні SAS.
Відповідь: У програмуванні SAS значення пошуку таблиці можна зберігати такими способами:
- Код
- Масив
- Хеш-об’єкт
- Формат
- Набір даних
Для здійснення 'пошуку таблиць' у SAS використовуються такі методи:
- Оператори SELECT / WHEN або IF / THEN
- Значення індексу масиву
- Значення ключа об’єкта хешу
- Оператор FORMAT, функція PUT
- Злиття, приєднання, КЛЮЧ = Варіант
Давайте побачимо приклад, який показує спосіб «Коду» для пошуку таблиці за допомогою операторів «IF / THEN»:
data location; set myinfo; if AreaCode='226' then Location='Ontario, Canada'; else if AreaCode='212' then Location='New York, NY'; else Location='Unknown'; run;
Q # 21) Розрізняти функції CEIL та FOOOR.
Відповідь: функція CEIL використовується для усічення числових значень, де він відображає вихідні дані як найменше ціле число. Під найменшим цілим числом тут розуміється, що ціле значення більше / дорівнює аргументу.
Приклад: CEIL (12.85) відображатиме вихід як 13.
Функція FLOOR використовується для усічення числових значень, де він відображає вихідні дані як найбільше ціле число. Під найбільшим цілим числом тут мається на увазі, що ціле значення менше / дорівнює аргументу.
Приклад: FLOOR (12.85) відображатиме вихід як 12.
Q # 22) Якими способами можна створювати макрозмінні у програмуванні SAS?
Відповідь: Ну, для створення макрозмінних у програмуванні SAS можна використовувати ряд різних методів.
Нижче наведено п’ять найбільш часто використовуваних методів:
- Оператор% LET
- Параметри макросу (іменовані, а також позиційні)
- Оператор% DO (ітеративний)
- INTO в PROC SQL
- Рутина CALL SYMPUTX
Q # 23) Поясніть мету твердження RETAIN.
Відповідь: Оскільки значення слова „RETAIN” означає збереження одного разу присвоєного значення, то твердження RETAIN є таким самим у програмуванні SAS, що і означає його значення.
У програмі SAS, коли потрібно перейти від поточної ітерації до наступного кроку даних, тоді оператор RETAIN говорить SAS зберігати значення, а не встановлювати їх як відсутні.
Приклад: Давайте надрукуємо програму, яка відображатиме вихідне значення «z», починаючи з 1, використовуючи оператор RETAIN.
data abc; set xyz; RETAIN z 0; z = z + 1; run;
Q # 24) Яка команда використовується для збереження журналів у зовнішньому файлі?
Відповідь: ДРУКОВАНИЙ ПРОЦЕС команда використовується для збереження журналів у зовнішньому файлі.
чим відкрити файли bin
Приклад:
PROC PRINTTO log='C:UsersabcDownloadsLOG11.txt' new; run;
Q # 25) Згадайте деякі типові помилки, які зазвичай допускаються при програмуванні SAS.
Відповідь: Нижче наведено деякі типові помилки, які зазвичай допускаються, особливо коли ви не знайомі з цією мовою програмування.
- Основний синтаксис включає крапку з комою в кінці кожного висловлювання, а відсутність крапки з комою є найпоширенішою помилкою.
- Ви пропускаєте перевірку журналів після подання програми.
- Коментування помилок, таких як невикористання коментарів там, де це необхідно, або використання коментарів невідповідним чином.
- Не використовуючи належні методи налагодження.
Q # 26) Згадайте параметри системи SAS для налагодження макросів SAS.
Відповідь: Щоб допомогти у відстеженні макрокоду, а також коду SAS, згенерованого макросами, можна використовувати деякі системні параметри.
Вони є:
- МЛОГІКА
- MPRINT
- СИМВОЛИ
Повідомлення, яке буде сформовано цими системними опціями, можна побачити в журналі SAS.
Q # 27) Диференціювати функції SAS та процедури SAS.
Відповідь: Основні відмінності можна виявити / зрозуміти у випадку, що пояснюється як для функцій SAS, так і для процедур.
Випадок:
Для Функція , значення аргументу подається або сказується, прийняте для обчислення, у спостереженні, згаданому в інструкції програми, тоді як, у випадку Процедура , очікується, що кожне спостереження матиме лише одну змінну, за допомогою якої проводиться обчислення, як зазначено у прикладі нижче.
Давайте зрозуміємо це на прикладах:
data average; set temp; avgtemp = mean( of T1 – T24 ); run;
У наведених вище прикладах аргументи, передані середній функції, приймаються для обчислення як спостереження.
proc sort; by month; run; proc means; by month; var avgtemp; run;
У наведеному вище прикладі функція Proc означає, що обчислює середню температуру для одного аргументу, який передається як спостереження, тобто за місяцем.
Q # 28) Що ви знаєте про SYMPUT та SYMGET?
Відповідь: Основні відмінності між ними зазначені нижче.
SYMPUT використовується для зберігання значення набору даних у макросмінній, тоді як SYMGET використовується для отримання значення із змінної макросу в набір даних.
Q # 29) Поясніть спеціальні роздільники вводу, що використовуються при програмуванні SAS.
Відповідь: Спеціальними роздільниками вводу, що використовуються при програмуванні SAS, є:
- DLM
- DSD
Вони використовуються у твердженні „INFILE”, а DSD має функцію ігнорування роздільників, які з’являються у лапках.
Q # 30) Яка функція використовується для підрахунку кількості інтервалів між двома датами SAS?
Відповідь: Функція інтервалу INTCK використовується для підрахунку кількості інтервалів між двома даними SAS.
Синтаксис:
INTCK(interval,start-of-period,end-of-period)
Висновок
Наразі ми бачили безліч запитань та відповідей, які дали б вам чітке розуміння концепцій програмування SAS, а також дали уявлення про природу питань, що задаються в інтерв’ю SAS.
Ну, якщо ви новачок у програмуванні SAS, знання деяких технологій комп’ютерного програмування та знання SQL (мови структурованих запитів) стане додатковою перевагою для розуміння та швидкого вивчення SAS.
Сподіваємось, ви готові впевнено зіткнутися з будь-яким інтерв’ю SAS !!